Làm cách nào để xem tệp xlsx trong python?
Đọc file Excel (phần mở rộng. xlsx,. xls) với Python Pandas. Để đọc tệp excel dưới dạng DataFrame, hãy sử dụng phương pháp pandas 12 Show
Bạn có thể đọc trang đầu tiên, trang cụ thể, nhiều trang hoặc tất cả các trang. Pandas chuyển đổi cấu trúc này thành cấu trúc DataFrame, đây là cấu trúc dạng bảng khóa học liên quan. Phân tích dữ liệu với Python Pandas ExcelTrong bài viết này, chúng tôi sử dụng một tệp Excel ví dụ. Các chương trình chúng tôi sẽ thực hiện để đọc Excel thành Python Tạo một file excel gồm 2 sheet sheet1 và sheet2. Bạn có thể sử dụng bất kỳ chương trình hỗ trợ Excel nào như Microsoft Excel hoặc Google Sheets Nội dung của từng cái như sau tờ1 tờ2 Cài đặt xlrdgấu trúc. . read_excel một. ) sử dụng thư viện có tên xlrd trong nội bộ xlrd là một thư viện để đọc (nhập) tệp Excel (. xlsx,. xls) bằng Python bài viết liên quan. Cách dùng xlrd, xlwt đọc ghi file Excel bằng Python Nếu bạn gọi gấu trúc. read_excel s() trong môi trường chưa cài đặt xlrd, bạn sẽ nhận được thông báo lỗi tương tự như sau
xlrd có thể được cài đặt bằng pip. (pip3 tùy thuộc vào môi trường) 1 $ pip install xlrd đọc excelChỉ định đường dẫn hoặc URL của tệp Excel trong đối số đầu tiên. 1 import pandas as pd Đoạn code trên xuất ra nội dung sheet excel 1 Unnamed: 0 A B C Nhận trang tínhBạn có thể chỉ định trang tính để đọc với đối số sheet_name Chỉ định theo số (bắt đầu từ 0) 1 df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1) 1 10 Chỉ định theo tên trang tính 1 $ pip install xlrd1____5 10 Tải nhiều tờCũng có thể chỉ định một danh sách trong đối số sheet_name. Nó là OK ngay cả khi nó là một số 0 bắt đầu hoặc tên trang tính Số hoặc tên trang tính được chỉ định là khóa chính và gấu trúc dữ liệu. DataFrame được đọc dưới dạng từ điển được đặt hàng OrderedDict với giá trị giá trị Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel 15 Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls' Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng 16 Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python Dữ liệu được nhập vào PythonGiả sử rằng bạn có bảng sau được lưu trữ trong Excel (trong đó tên tệp Excel là 'sản phẩm') product_namepricecomputer700tablet250printer120laptop1200keyboard100Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python Các bước để nhập tệp Excel vào Python bằng PandasBước 1. Chụp đường dẫn tập tinTrước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau C. \Users\Ron\Desktop\ sản phẩm. xlsx Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn Đừng quên bao gồm tên tệp (trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam). Bạn cũng cần bao gồm phần mở rộng tệp Excel (trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục). Bước 2. Áp dụng mã PythonĐây là mã Python cho ví dụ của chúng tôi 17 Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’ Bước 3. Chạy mã Python để nhập tệp ExcelChạy mã Python (được điều chỉnh theo đường dẫn của bạn) và bạn sẽ nhận được tập dữ liệu sau 18 Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd' Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx 19 Bước tùy chọn. Chọn tập hợp con của các cộtBây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao? Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao? $ pip install xlrd0 Chạy mã (sau khi điều chỉnh đường dẫn tệp) và bạn sẽ chỉ nhận được cột product_name $ pip install xlrd1 Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này $ pip install xlrd2 Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN Sự kết luậnBạn vừa xem cách nhập tệp Excel vào Python bằng Pandas Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel Làm cách nào để xem tệp XLSX?Cách mở tệp XLSX . Bước 1. Nhấp đúp chuột vào tệp XLSX. Để mở tệp XLSX trong Excel, chỉ cần nhấp đúp vào tệp. . Bước 2. Kéo và thả tệp XLSX vào cửa sổ Excel để mở tệp. . Bước 3. “Open with” – mở tệp XLSX trong Excel bằng menu chuột phải Chúng tôi có thể đọc tệp XLSX trong gấu trúc không?Đọc tệp Excel vào DataFrame của gấu trúc. Hỗ trợ các phần mở rộng tệp xls , xlsx , xlsm , xlsb , odf , ods và odt được đọc từ hệ thống tệp cục bộ hoặc URL . Hỗ trợ tùy chọn đọc một trang tính hoặc danh sách các trang tính. Mọi đường dẫn chuỗi hợp lệ đều được chấp nhận. |