PD read_excel trả về cái gì?

Với sự trợ giúp của phương thức Pandas read_excel(), chúng ta cũng có thể lấy chi tiết tiêu đề. Nó thường chuyển đổi từ biểu diễn csv, dict, json sang đối tượng DataFrame

Pandas read_excel

Để đọc tệp excel trong Python, hãy sử dụng phương thức read_excel() của Pandas. read_excel() là một chức năng thư viện Pandas được sử dụng để đọc dữ liệu trang tính excel vào một đối tượng DataFrame. Nó được thể hiện trong dạng xem dạng bảng hai chiều.

Rất nhiều công việc trong Python xoay quanh việc làm việc trên các bộ dữ liệu khác nhau, phần lớn hiện diện ở dạng biểu diễn csv, json. Vì vậy, để sử dụng dữ liệu của các bộ dữ liệu đó trong Python, chúng tôi có một thư viện gấu trúc và trong thư viện đó, chúng tôi có một phương thức gọi là read_excel() để đọc dữ liệu từ các tệp excel

cú pháp

pandas.read_excel(io, sheet_name=0, header=0, 
names=None, index_col=None, 
usecols=None, squeeze=False, dtype=None, 
engine=None, converters=None, true_values=None, 
false_values=None, skiprows=None, nrows=None, 
na_values=None, keep_default_na=True, verbose=False, 
parse_dates=False, date_parser=None, thousands=None, 
comment=None, skipfooter=0, convert_float=True, 
mangle_dupe_cols=True, **kwds)

Thông số

read_excel() có các tham số sau

  1. io. Nó có thể hiện diện ở dạng str, byte, ExcelFile, xlrd. Sách, v.v. Bất kỳ chuỗi hợp lệ nào cũng được chấp nhận. Nó có thể là một URL ở dạng http, https, s3, v.v.
  2. sheet_name. Giá trị mặc định là 0. Nó có thể có các giá trị str, int, list hoặc Không có. Chuỗi được sử dụng cho tên trang tính
  3. tiêu đề. Giá trị mặc định của nó là 0. Nó có thể có các giá trị của kiểu dữ liệu int hoặc một danh sách của int. Hàng được sử dụng cho các nhãn cột của DataFrame được phân tích cú pháp
  4. tên. Theo mặc định, giá trị của nó là Không. Nó chấp nhận một cấu trúc giống như mảng. Đó là tên cột để sử dụng
  5. chỉ mục_col. Nó cũng mất Không theo mặc định. Nó có thể có các giá trị kiểu int hoặc danh sách lint. Cột để sử dụng làm nhãn hàng của DataFrame. Nếu không có cột nào như vậy, thì người dùng phải vượt qua Không có
  6. sử dụng. Nó cũng không nhận theo mặc định và có thể có các giá trị như int, str, cấu trúc giống như danh sách
  7. vắt kiệt. Nó nhận các giá trị Boolean. Theo mặc định, giá trị của nó là Sai.  
  8. gõ. Đó là tên loại hoặc chính tả của cột
  9. động cơ. Nó nhận các giá trị str và theo mặc định là Không có. Nếu io không phải là bộ đệm hoặc đường dẫn, thì điều này phải được đặt thành danh tính io
  10. bộ chuyển đổi. Nó là một cuốn từ điển và theo mặc định, nó lấy Không có. Từ điển các hàm để chuyển đổi giá trị trong các cột cụ thể.  
  11. true_values. Nó cần một danh sách; . Các giá trị được coi là đúng
  12. false_values. Nó cũng có một danh sách; . Các giá trị được coi là Sai
  13. mũi dùi. Đó là các hàng cần bỏ qua ở đầu (được lập chỉ mục 0)
  14. cau mày. Nó đại diện cho số lượng hàng để phân tích cú pháp
  15. na_values. Nó là chuỗi bổ sung để nhận ra các giá trị NA/NaN
  16. keep_default_na. Nó nhận các giá trị Boolean và theo mặc định, nó được đặt thành True. Nó xác định có lấy giá trị NaN mặc định khi phân tích dữ liệu hay không
  17. na_filter. Nó nhận một giá trị Boolean và theo mặc định, nó là True. Nó phát hiện các điểm đánh dấu giá trị còn thiếu
  18. dài dòng. Nó chỉ ra một số giá trị NA được đặt trong các cột không phải là số
  19. parse_dates. Nó cần bool, list-like hoặc dict. Theo mặc định, giá trị của nó được đặt thành Sai
  20. date_parser. Nó là một chức năng tùy chọn. Hàm này được sử dụng để chuyển đổi một chuỗi các cột chuỗi thành một mảng các thể hiện thời gian
  21. hàng ngàn. Nó nhận các giá trị str. Theo mặc định, nó là Không có. Nghìn dấu tách để phân tích các cột chuỗi thành số
  22. nhận xét. Nó cũng nhận các giá trị str. Theo mặc định, nó là Không có. Nó nhận xét phần còn lại của dòng
  23. người bỏ qua. Nó nhận các giá trị nguyên. Theo mặc định, nó được đặt thành 0. Nó bảo các hàng ở cuối bỏ qua
  24. convert_float. Nó nhận một giá trị boolean và giá trị mặc định của nó là true. Nó chuyển đổi số float tích phân thành int.  
  25. mangle_dupe_cols. Nó nhận các giá trị boolean và theo mặc định là True. Trong cột trùng lặp này sẽ được chỉ định là X, X. 1,X. 2…. X. N, thay vì X, X, X,…. X. Chuyển Sai làm tham số sẽ khiến dữ liệu bị ghi đè nếu có tên trùng lặp trong cột
  26. **kwds. Nó là một tham số tùy chọn. Từ khóa tùy chọn là đối số có thể được chuyển đến TextFileReader

Giá trị trả về

Phương thức read_excel() trả về DataFrame hoặc Dictionary of DataFrames. DataFrame chứa dữ liệu của bảng excel.

Chương trình ví dụ về pandas. read_excel()

Viết chương trình hiển thị hoạt động của gấu trúc. read_excel()

Trong ví dụ này, chúng tôi đang sử dụng một readfile. tập tin xlsx. Bạn có thể tải về từ đây

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
print(df)

đầu ra

Ở đầu ra, bạn có thể gặp lỗi sau, tùy thuộc vào phần phụ thuộc được cài đặt trên máy của bạn

Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'. Cài đặt xlrd >= 1. 0. 0 để được hỗ trợ Excel Sử dụng pip hoặc conda để cài đặt xlrd

Để giải quyết ImportError này, bạn phải cài đặt mô-đun xlrd. Gõ lệnh sau

python3 -m pip install xlrd

Nó sẽ cài đặt mô-đun và bây giờ chạy lại tệp

  Name  Roll no  maths  science  english
0  Rohit        1     93       88       93
1   Arun        2     63       66       74
2  Sohit        3     55       66       84
3   Arun        4     94       94       92
4  Shubh       33     83       77       87

Tham số đầu tiên là tên của tệp excel

Khi chúng ta in đối tượng DataFrame, đầu ra là một bảng hai chiều. Nó trông giống như một bản ghi excel

Nếu cột đầu tiên trong tệp Excel hoặc CSV có giá trị chỉ mục, thì bạn có thể thực hiện các thao tác sau để xóa cột Chưa đặt tên trong Pandas

pd.read_excel('readfile.xlsx', index_col=0)

Nếu chúng tôi đã xác định index_col = 0, thì nó sẽ bỏ qua cột không tên đầu tiên

Nếu cột chưa được đặt tên không phải là cột đầu tiên, bạn có thể viết dòng sau để xóa nó khỏi bất kỳ chỉ mục nào

import pandas as pd

df = pd.read_excel('readfile.xlsx')
df = df.loc[:, ~df.columns.str.contains('^Unnamed')]
print(df)

đầu ra

 Name  Roll no  maths  science  english
0  Rohit        1     93       88       93
1   Arun        2     63       66       74
2  Sohit        3     55       66       84
3   Arun        4     94       94       92
4  Shubh       33     83       77       87

Ở đây trong đoạn mã trên, chúng ta có thể thấy rằng chúng ta đã sử dụng phương thức read_excel() để trích xuất dữ liệu của một xlsx (tệp excel), được tạo trước đó và lưu trong cùng thư mục với tệp py chứa dữ liệu của một số sinh viên

Lấy danh sách các tiêu đề cột của trang tính Excel

Để lấy danh sách các tiêu đề cột, hãy sử dụng cột. phương thức ravel ().

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
cols = df.columns.ravel()
print(cols)

đầu ra

________số 8

Bạn có thể thấy rằng chúng tôi nhận được danh sách tất cả các cột của DataFrame

In dữ liệu cột dưới dạng danh sách

Để in dữ liệu cột dưới dạng danh sách, hãy sử dụng lệnh df. phương thức tolist(). Hàm tolist() chuyển đổi các giá trị cột cụ thể thành danh sách

Hãy lấy danh sách các giá trị của cột Tên

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
vals_list = df['Name'].tolist()
print(vals_list)

đầu ra

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
print(df)
0

Đọc tệp Excel không có hàng tiêu đề

Nếu bảng excel không có bất kỳ hàng tiêu đề nào, hãy chuyển giá trị tham số tiêu đề là Không có

Xem đoạn mã sau

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
print(df)
1

Nếu bạn muốn hành động tiêu đề dưới dạng một hàng cụ thể, bạn phải chuyển giá trị tiêu đề dưới dạng số nguyên

Nếu bạn đã chuyển hàng thứ 4 làm hàng tiêu đề, thì hàng thứ tư sẽ được coi là hàng tiêu đề và các giá trị sẽ được đọc từ hàng tiếp theo trở đi

Chuyển đổi Dữ liệu Excel sang Dict, CSV và JSON

Để chuyển đổi DataFrame thành JSON trong Python, hãy sử dụng phương thức Pandas to_json()

Để chuyển đổi DataFrame thành CSV bằng Python, hãy sử dụng phương thức Pandas DataFrame to_csv()

Để chuyển đổi DataFrame thành Dictionary trong Python, hãy sử dụng phương thức Pandas DataFrame to_dict()

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
print(df)
2

đầu ra

import pandas as pd

df = pd.read_excel('readfile.xlsx', index_col=0)
print(df)
3

Phần kết luận

Để nhập tệp Excel vào Python bằng gấu trúc, hãy sử dụng lệnh pd. phương thức read_excel(). Đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls' thay vì 'xlsx'

Xem thêm

Cách nhập tệp CSV trong Pandas

Xuất Khung dữ liệu Pandas sang CSV

Chuyển đổi Pandas JSON sang CSV

Gấu trúc ExcelWriter()

Pandas DataFrame thành mảng Numpy

Facebook

Twitter

Pinterest

WhatsApp

Bài viết trước Cách tính toán hoán vị trong Python

Bài viết tiếp theo Điều hướng bộ định tuyến 13 góc. Hướng dẫn đầy đủ

PD read_excel trả về cái gì?

Ankit Lathiya

Ankit Lathiya là Bậc thầy về Ứng dụng Máy tính theo chuyên môn và là Nhà phát triển Android và Laravel chuyên nghiệp, đồng thời là một trong những tác giả của blog này

pandas read_excel trả về cái gì?

gấu trúc. hàm read_excel() được sử dụng để đọc bảng excel có phần mở rộng xlsx vào DataFrame của gấu trúc. Bằng cách đọc một trang tính, nó trả về một đối tượng DataFrame gấu trúc, nhưng đọc hai trang tính, nó trả về một Dict of DataFrame .

PD read_excel hoạt động như thế nào?

Để đọc tệp excel dưới dạng DataFrame, hãy sử dụng phương thức pandas read_excel(). Bạn có thể đọc trang đầu tiên, trang cụ thể, nhiều trang hoặc tất cả các trang. Pandas chuyển đổi cấu trúc này thành cấu trúc DataFrame, là cấu trúc dạng bảng .

PD read_excel có tạo DataFrame không?

DataFrame được tạo bằng hàm read_excel() . Từ DataFrame, chúng ta có thể sử dụng dữ liệu một cột để tạo một danh sách bằng cách sử dụng tolist().

Làm cách nào để đọc giá trị ô excel trong gấu trúc python?

Cách đọc một giá trị từ XLS(X) bằng pandas .
Bài kiểm tra. .
bỏ qua = 2. Số hàng trừ đi một, vì vậy hàng mong muốn là hàng đầu tiên chúng tôi đọc
sử dụngcols="C". Những cột nào chúng tôi quan tâm – chỉ một
mũi tên = 1. Chỉ đọc một hàng
tiêu đề = Không có. Đừng cho rằng hàng đầu tiên chúng ta đọc là hàng tiêu đề