Hướng dẫn can pandas read excel files? - gấu trúc có thể đọc tệp excel không?

Đọc các tệp excel (tiện ích mở rộng: .xlsx, .xls) với python pandas. Để đọc tệp Excel dưới dạng DataFrame, hãy sử dụng phương thức Pandas

1
2
3
4
5
2.

Bạn có thể đọc tờ đầu tiên, tờ cụ thể, nhiều tờ hoặc tất cả các tờ. Pandas chuyển đổi điều này thành cấu trúc DataFrame, là một cấu trúc giống như bảng.

Khóa học liên quan: Phân tích dữ liệu với Python Pandas Data Analysis with Python Pandas

Excel

Trong bài viết này, chúng tôi sử dụng một tệp excel ví dụ. Các chương trình mà chúng tôi sẽ làm cho đọc xuất sắc thành Python.

Tạo một tệp Excel với hai tờ, Sheet1 và Sheet2. Bạn có thể sử dụng bất kỳ chương trình hỗ trợ Excel nào như Microsoft Excel hoặc Google Sheets.

Nội dung của mỗi nội dung như sau:

sheet1:

Hướng dẫn can pandas read excel files? - gấu trúc có thể đọc tệp excel không?

sheet2:

Hướng dẫn can pandas read excel files? - gấu trúc có thể đọc tệp excel không?

Cài đặt XLRD

Gấu trúc. .read_excel a.) uses a library called xlrd internally.

XLRD là một thư viện để đọc (đầu vào) các tệp excel (.xlsx, .xls) trong python.

Bài viết liên quan: Cách sử dụng XLRD, XLWT để đọc và ghi các tệp Excel trong Python

Nếu bạn gọi pandas.read_excel s () trong môi trường không cài đặt XLRD, bạn sẽ nhận được thông báo lỗi tương tự như sau:

Bộ nhập khẩu: Cài đặt XLRD> = 0.9.0 cho hỗ trợ Excel

XLRD có thể được cài đặt với PIP. (PIP3 tùy thuộc vào môi trường)

1
$ pip install xlrd

Đọc Excel

Chỉ định đường dẫn hoặc URL của tệp Excel trong đối số đầu tiên. Nếu có nhiều bảng, chỉ có bảng đầu tiên được Pandas.it đọc là DataFrame.
If there are multiple sheets, only the first sheet is used by pandas.
It reads as DataFrame.

1
2
3
4
5
import pandas as pd

df = pd.read_excel('sample.xlsx')

print(df)

Mã trên xuất ra nội dung bảng Excel:

1
2
3
4
  Unnamed: 0   A   B   C
0 one 11 12 13
1 two 21 22 23
2 three 31 32 33

Nhận tờ

Bạn có thể chỉ định trang tính để đọc với argune feet_name.

Chỉ định theo số (bắt đầu từ 0)

1
2
3
df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)

print(df_sheet_index)
1
2
3
4
  Unnamed: 0   A   B   C
0 one 11 12 13
1 two 21 22 23
2 three 31 32 33

Nhận tờ

1
2
3
df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)

print(df_sheet_index)
1
2
3
4
  Unnamed: 0   A   B   C
0 one 11 12 13
1 two 21 22 23
2 three 31 32 33

Nhận tờ

Bạn có thể chỉ định trang tính để đọc với argune feet_name.

Chỉ định theo số (bắt đầu từ 0)

1
2
3
df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)

print(df_sheet_index)

#        AA  BB  CC
# ONE 11 12 13
# TWO 21 22 23
# THREE 31 32 33

Chỉ định theo tên trang:
$ pip install xlrd
1

Tải nhiều tờ

Cũng có thể chỉ định một danh sách trong armentSheet_name. Nó là ok ngay cả khi đó là một số 0 bắt đầu hoặc tên trang tính.

Số được chỉ định hoặc tên trang tính là khóa khóa và gấu trúc dữ liệu. DataFrame được đọc dưới dạng từ điển theo thứ tự đã đặt hàng với giá trị giá trị.
$ pip install xlrd
5

Sau đó, bạn có thể sử dụng nó như thế này:

Chỉ định theo tên trang:
$ pip install xlrd
1

Khóa học liên quan: Phân tích dữ liệu với Python Pandas Data Analysis with Python Pandas