Làm cách nào để xem tệp xlsx trong python?

Đọc file Excel [phần mở rộng. xlsx,. xls] với Python Pandas. Để đọc tệp excel dưới dạng DataFrame, hãy sử dụng phương pháp pandas

1
2
3
4
5
2

Bạn có thể đọc trang đầu tiên, trang cụ thể, nhiều trang hoặc tất cả các trang. Pandas chuyển đổi cấu trúc này thành cấu trúc DataFrame, đây là cấu trúc dạng bảng

khóa học liên quan. Phân tích dữ liệu với Python Pandas

Excel

Trong bài viết này, chúng tôi sử dụng một tệp Excel ví dụ. Các chương trình chúng tôi sẽ thực hiện để đọc Excel thành Python

Tạo một file excel gồm 2 sheet sheet1 và sheet2. Bạn có thể sử dụng bất kỳ chương trình hỗ trợ Excel nào như Microsoft Excel hoặc Google Sheets

Nội dung của từng cái như sau

tờ1

tờ2

Cài đặt xlrd

gấu trúc. . read_excel một. ] sử dụng thư viện có tên xlrd trong nội bộ

xlrd là một thư viện để đọc [nhập] tệp Excel [. xlsx,. xls] bằng Python

bài viết liên quan. Cách dùng xlrd, xlwt đọc ghi file Excel bằng Python

Nếu bạn gọi gấu trúc. read_excel s[] trong môi trường chưa cài đặt xlrd, bạn sẽ nhận được thông báo lỗi tương tự như sau

Nhập Lỗi. Cài đặt xlrd >= 0. 9. 0 để được hỗ trợ Excel

xlrd có thể được cài đặt bằng pip. [pip3 tùy thuộc vào môi trường]

1
$ pip install xlrd

đọc excel

Chỉ định đường dẫn hoặc URL của tệp Excel trong đối số đầu tiên.
Nếu có nhiều trang tính, gấu trúc chỉ sử dụng trang tính đầu tiên.
Nó đọc là DataFrame.

1
2
3
4
5
import pandas as pd

df = pd.read_excel['sample.xlsx']

print[df]

Đoạn code trên xuất ra nội dung sheet excel

1
2
3
4
  Unnamed: 0   A   B   C
0 one 11 12 13
1 two 21 22 23
2 three 31 32 33

Nhận trang tính

Bạn có thể chỉ định trang tính để đọc với đối số sheet_name

Chỉ định theo số [bắt đầu từ 0]

1
2
3
df_sheet_index = pd.read_excel['sample.xlsx', sheet_name=1]

print[df_sheet_index]
1
2
3
4
1
0

Chỉ định theo tên trang tính

1
2
3
$ pip install xlrd
1____5
1
0

Tải nhiều tờ

Cũng có thể chỉ định một danh sách trong đối số sheet_name. Nó là OK ngay cả khi nó là một số 0 bắt đầu hoặc tên trang tính

Số hoặc tên trang tính được chỉ định là khóa chính và gấu trúc dữ liệu. DataFrame được đọc dưới dạng từ điển được đặt hàng OrderedDict với giá trị giá trị

Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel

1
5

Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'

Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng

1
6

Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python

Dữ liệu được nhập vào Python

Giả sử rằng bạn có bảng sau được lưu trữ trong Excel [trong đó tên tệp Excel là 'sản phẩm']

product_namepricecomputer700tablet250printer120laptop1200keyboard100

Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python

Các bước để nhập tệp Excel vào Python bằng Pandas

Bước 1. Chụp đường dẫn tập tin

Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn

Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau

C. \Users\Ron\Desktop\ sản phẩm. xlsx

Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn

Đừng quên bao gồm tên tệp [trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam]. Bạn cũng cần bao gồm phần mở rộng tệp Excel [trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục].

Bước 2. Áp dụng mã Python

Đây là mã Python cho ví dụ của chúng tôi

1
7

Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’

Bước 3. Chạy mã Python để nhập tệp Excel

Chạy mã Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được tập dữ liệu sau

1
8

Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel

Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã

Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'

Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx

1
9

Bước tùy chọn. Chọn tập hợp con của các cột

Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?

Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?

$ pip install xlrd
0

Chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được cột product_name

$ pip install xlrd
1

Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này

$ pip install xlrd
2

Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN

Sự kết luận

Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas

Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas

Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel

Làm cách nào để xem tệp XLSX?

Cách mở tệp XLSX .
Bước 1. Nhấp đúp chuột vào tệp XLSX. Để mở tệp XLSX trong Excel, chỉ cần nhấp đúp vào tệp. .
Bước 2. Kéo và thả tệp XLSX vào cửa sổ Excel để mở tệp. .
Bước 3. “Open with” – mở tệp XLSX trong Excel bằng menu chuột phải

Chúng tôi có thể đọc tệp XLSX trong gấu trúc không?

Đọc tệp Excel vào DataFrame của gấu trúc. Hỗ trợ các phần mở rộng tệp xls , xlsx , xlsm , xlsb , odf , ods và odt được đọc từ hệ thống tệp cục bộ hoặc URL . Hỗ trợ tùy chọn đọc một trang tính hoặc danh sách các trang tính. Mọi đường dẫn chuỗi hợp lệ đều được chấp nhận.

Chủ Đề