Hướng dẫn does pd read_excel create a dataframe? - pd read_excel có tạo khung dữ liệu không?

pandas.read_excel (io, sheet_name = 0, *, header = 0, name = none, index_col = none, usecols = none, squeeze = none, dtype = none Không, SKIPROWS = Không, NROWS = Không, Na_Values ​​= Không 0,read_excel(io, sheet_name=0, *, header=0, names=None, index_col=None, usecols=None, squeeze=None, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, decimal='.', comment=None, skipfooter=0, convert_float=None, mangle_dupe_cols=True, storage_options=None)[source]#

Đọc một tập tin Excel vào một bản dữ liệu gấu trúc.

Hỗ trợ XLS, XLSX, XLSM, XLSB, ODF, ODF và Tệp ODT được đọc từ hệ thống tập tin hoặc URL cục bộ. Hỗ trợ một tùy chọn để đọc một tờ hoặc một danh sách các tờ.

Tham số, byte, excelfile, xlrd.book, đối tượng đường dẫn hoặc đối tượng giống như tệpiostr, bytes, ExcelFile, xlrd.Book, path object, or file-like object

Bất kỳ đường dẫn chuỗi hợp lệ đều được chấp nhận. Chuỗi có thể là một url. Các sơ đồ URL hợp lệ bao gồm HTTP, FTP, S3 và Tệp. Đối với URL tệp, một máy chủ được dự kiến. Một tập tin cục bộ có thể là: file://localhost/path/to/table.xlsx.

Nếu bạn muốn vượt qua trong một đối tượng đường dẫn, Pandas chấp nhận bất kỳ os.PathLike nào.

Theo đối tượng giống như tệp, chúng tôi đề cập đến các đối tượng bằng phương thức read(), chẳng hạn như xử lý tệp (ví dụ: thông qua hàm tích hợp open) hoặc

>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3
0.

sheet_namestr, int, danh sách hoặc không có, mặc định 0str, int, list, or None, default 0

Chuỗi được sử dụng cho tên trang. Các số nguyên được sử dụng trong các vị trí tấm không chỉ số (bảng biểu đồ không được tính là một vị trí bảng). Danh sách các chuỗi/số nguyên được sử dụng để yêu cầu nhiều tờ. Chỉ định không có để có được tất cả các bảng tính.

Các trường hợp có sẵn:

  • Mặc định là bảng

    >>> pd.read_excel(open('tmp.xlsx', 'rb'),
    ...               sheet_name='Sheet3')  
       Unnamed: 0      Name  Value
    0           0   string1      1
    1           1   string2      2
    2           2  #Comment      3
    
    1: 1ST dưới dạng DataFrame

  • >>> pd.read_excel(open('tmp.xlsx', 'rb'),
    ...               sheet_name='Sheet3')  
       Unnamed: 0      Name  Value
    0           0   string1      1
    1           1   string2      2
    2           2  #Comment      3
    
    2: Bảng thứ 2 dưới dạng DataFrame

  • >>> pd.read_excel(open('tmp.xlsx', 'rb'),
    ...               sheet_name='Sheet3')  
       Unnamed: 0      Name  Value
    0           0   string1      1
    1           1   string2      2
    2           2  #Comment      3
    
    3: Bảng tải có tên

  • >>> pd.read_excel(open('tmp.xlsx', 'rb'),
    ...               sheet_name='Sheet3')  
       Unnamed: 0      Name  Value
    0           0   string1      1
    1           1   string2      2
    2           2  #Comment      3
    
    4: Tải đầu tiên, thứ hai và trang tính có tên

  • Không: Tất cả các bảng tính.

headerint, danh sách int, mặc định 0int, list of int, default 0

Hàng (0 chỉ số) để sử dụng cho các nhãn cột của khung dữ liệu được phân tích cú pháp. Nếu một danh sách các số nguyên được thông qua các vị trí hàng, các vị trí hàng sẽ được kết hợp thành một

>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3
5. Không sử dụng nếu không có tiêu đề.

tên tuổi giống như mặc định, không có gìarray-like, default None

Danh sách các tên cột để sử dụng. Nếu tệp không chứa hàng tiêu đề, thì bạn nên chuyển tiêu đề một cách rõ ràng = không có.

index_colint, danh sách int, không có mặc địnhint, list of int, default None

Cột (0 chỉ số) để sử dụng làm nhãn hàng của DataFrame. Không có nếu không có cột như vậy. Nếu một danh sách được thông qua, các cột đó sẽ được kết hợp thành

>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3
5. Nếu một tập hợp dữ liệu được chọn với
>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3
7, index_col dựa trên tập hợp con.

Các giá trị bị thiếu sẽ được lấp đầy để cho phép khứ hồi với

>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3
8 cho
>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3
9. Để tránh chuyển tiếp, việc sử dụng các giá trị bị thiếu
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
0 sau khi đọc dữ liệu thay vì
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
1.

usecolsstr, danh sách giống như hoặc có thể gọi được, không có mặc địnhstr, list-like, or callable, default None
  • Nếu không, sau đó phân tích tất cả các cột.

  • Nếu str, sau đó chỉ ra danh sách phân tách dấu phẩy của các chữ cái và phạm vi cột Excel (ví dụ: A: E, hoặc A A, C, E: Fiêu). Phạm vi bao gồm cả hai bên.

  • Nếu danh sách INT, thì hãy chỉ ra danh sách các số cột được phân tích cú pháp (0 chỉ số).

  • Nếu danh sách chuỗi, sau đó chỉ ra danh sách các tên cột được phân tích cú pháp.

  • Nếu có thể gọi được, sau đó đánh giá từng tên cột so với nó và phân tích cột nếu có thể gọi được trả về

    >>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
         0         1      2
    0  NaN      Name  Value
    1  0.0   string1      1
    2  1.0   string2      2
    3  2.0  #Comment      3
    
    2.

Trả về một tập hợp con của các cột theo hành vi ở trên.

Squeezebool, mặc định saibool, default False

Nếu dữ liệu được phân tích cú pháp chỉ chứa một cột thì hãy trả về một chuỗi.

Đã không dùng nữa kể từ phiên bản 1.4.0: Phụ lục

>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
3 vào cuộc gọi đến
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
4 để bóp dữ liệu.Append
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
3 to the call to
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
4 to squeeze the data.

Tên DTYPETYPE hoặc DIGNT của cột -> Loại, mặc định không cóType name or dict of column -> type, default None

Kiểu dữ liệu cho dữ liệu hoặc cột. Ví dụ. {‘A, Nếu các bộ chuyển đổi được chỉ định, chúng sẽ được áp dụng thay vì chuyển đổi DTYPE.

enginest, mặc định không cóstr, default None

Nếu IO không phải là bộ đệm hoặc đường dẫn, điều này phải được đặt để xác định IO. Động cơ được hỗ trợ: Hồi XLRD ,, OpenPyxl ,, ODF, ODF, Khả năng tương thích động cơ:

  • XLRD, hỗ trợ các tệp Excel kiểu cũ (.xls).

  • Cấm OpenPyxL, hỗ trợ các định dạng tệp Excel mới hơn.

  • ODF ODF hỗ trợ các định dạng tệp OpenDocument (.odf, .ods, .odt).

  • Cấm PYXLSB hỗ trợ các tệp excel nhị phân.

Đã thay đổi trong phiên bản 1.2.0: Công cụ XLRD hiện chỉ hỗ trợ các tệp

>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
5 kiểu cũ. Khi
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
6, logic sau đây sẽ được sử dụng để xác định động cơ:The engine xlrd now only supports old-style
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
5 files. When
>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3
6, the following logic will be used to determine the engine:

  • Nếu

    >>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
         0         1      2
    0  NaN      Name  Value
    1  0.0   string1      1
    2  1.0   string2      2
    3  2.0  #Comment      3
    
    7 là một định dạng OpenDocument (.Odf, .ods, .odt), thì ODF sẽ được sử dụng.

  • Mặt khác, nếu

    >>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
         0         1      2
    0  NaN      Name  Value
    1  0.0   string1      1
    2  1.0   string2      2
    3  2.0  #Comment      3
    
    7 là định dạng XLS,
    >>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
         0         1      2
    0  NaN      Name  Value
    1  0.0   string1      1
    2  1.0   string2      2
    3  2.0  #Comment      3
    
    9 sẽ được sử dụng.

  • Mặt khác, nếu

    >>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
         0         1      2
    0  NaN      Name  Value
    1  0.0   string1      1
    2  1.0   string2      2
    3  2.0  #Comment      3
    
    7 ở định dạng XLSB,
    >>> pd.read_excel('tmp.xlsx', index_col=0,
    ...               dtype={'Name': str, 'Value': float})  
           Name  Value
    0   string1    1.0
    1   string2    2.0
    2  #Comment    3.0
    
    1 sẽ được sử dụng.

    Mới trong phiên bản 1.3.0.

  • Nếu không

    >>> pd.read_excel('tmp.xlsx', index_col=0,
    ...               dtype={'Name': str, 'Value': float})  
           Name  Value
    0   string1    1.0
    1   string2    2.0
    2  #Comment    3.0
    
    2 sẽ được sử dụng.

    Thay đổi trong phiên bản 1.3.0.

ConverterSdict, mặc định không códict, default None

Diễn ngôn của các chức năng để chuyển đổi các giá trị trong các cột nhất định. Các phím có thể là số nguyên hoặc nhãn cột, các giá trị là các hàm lấy một đối số đầu vào, nội dung ô Excel và trả về nội dung được chuyển đổi.

true_valuesList, mặc định không cólist, default None

Giá trị để xem là đúng.

false_valuesList, mặc định không cólist, default None

Giá trị để coi là sai.

SkipRowsList giống như, int hoặc có thể gọi, tùy chọnlist-like, int, or callable, optional

Số dòng để bỏ qua (0 chỉ số) hoặc số dòng để bỏ qua (int) khi bắt đầu tệp. Nếu có thể gọi được, hàm có thể gọi sẽ được đánh giá theo các chỉ số hàng, trả về đúng nếu hàng nên được bỏ qua và sai. Một ví dụ về một đối số có thể gọi hợp lệ sẽ là

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
3.

nrowsint, mặc định không cóint, default None

Số lượng hàng để phân tích cú pháp.

NA_VALUESSCALAR, STR, DANH SÁCH, HOẶC DINHscalar, str, list-like, or dict, default None

Các chuỗi bổ sung để nhận ra là NA/NAN. Nếu Dict vượt qua, các giá trị NA mỗi cột cụ thể. Theo mặc định, các giá trị sau được hiểu là nan: '', '#n/a', '#n/a n/a', '#na', '-1.#Ind', '-1.#Qnan', '-Nan', '-nan', '1.#ind', '1.#qnan', '', 'n/a', 'na', 'null', 'nan', 'n/a' , 'nan', 'null'.

keep_default_nabool, mặc định đúngbool, default True

Có hay không bao gồm các giá trị NAN mặc định khi phân tích dữ liệu. Tùy thuộc vào việc NA_Values ​​được thông qua, hành vi như sau:

  • Nếu keep_default_na là đúng và na_values ​​được chỉ định, na_values ​​được thêm vào các giá trị NAN mặc định được sử dụng để phân tích cú pháp.

  • Nếu keep_default_na là đúng và na_values ​​không được chỉ định, chỉ có các giá trị NAN mặc định được sử dụng để phân tích cú pháp.

  • Nếu keep_default_na là sai và na_values ​​được chỉ định, chỉ có các giá trị nan được chỉ định na_values ​​được sử dụng để phân tích cú pháp.

  • Nếu keep_default_na là sai và na_values ​​không được chỉ định, không có chuỗi nào được phân tích cú pháp là nan.

Lưu ý rằng nếu Na_Filter được truyền dưới dạng sai, các tham số keep_default_na và na_values ​​sẽ bị bỏ qua.

na_filterbool, mặc định đúngbool, default True

Phát hiện các điểm đánh dấu giá trị bị thiếu (chuỗi trống và giá trị của NA_Values). Trong dữ liệu mà không có NAS, việc truyền Na_Filter = Sai có thể cải thiện hiệu suất của việc đọc một tệp lớn.

verbosebool, mặc định saibool, default False

Chỉ ra số lượng giá trị Na được đặt trong các cột không phải là số.

Parse_datesbool, Danh sách giống như hoặc Dict, mặc định FALSEbool, list-like, or dict, default False

Hành vi như sau:

  • bool. Nếu đúng -> thử phân tích cú pháp chỉ mục.

  • Danh sách INT hoặc tên. ví dụ. Nếu [1, 2, 3] -> thử phân tích các cột 1, 2, 3 mỗi cột là một cột ngày riêng biệt.

  • Danh sách danh sách. ví dụ. Nếu [[1, 3]] -> Kết hợp các cột 1 và 3 và phân tích cú pháp là một cột ngày duy nhất.

  • Diễn ngôn, ví dụ: {‘Foo,

Nếu một cột hoặc chỉ mục chứa một ngày không thể làm được, toàn bộ cột hoặc chỉ mục sẽ được trả về không thay đổi dưới dạng kiểu dữ liệu đối tượng. Nếu bạn không muốn phân tích một số ô như ngày, chỉ cần thay đổi loại của chúng trong Excel thành văn bản. Đối với phân tích dữ liệu không chuẩn, sử dụng

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
4 sau
>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
5.

Lưu ý: Một đường dẫn nhanh tồn tại trong các ngày được định dạng ISO8601.

date_parserfunction, tùy chọnfunction, optional

Chức năng sử dụng để chuyển đổi một chuỗi các cột chuỗi thành một mảng các phiên bản DateTime. Mặc định sử dụng

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
6 để thực hiện chuyển đổi. Pandas sẽ cố gắng gọi DATE_PARSER theo ba cách khác nhau, tiến sang cách tiếp theo nếu xảy ra ngoại lệ: 1) Truyền một hoặc nhiều mảng (theo định nghĩa của parse_dates) làm đối số; 2) Concatenate (hàng khôn ngoan) Các giá trị chuỗi từ các cột được xác định bởi parse_dates thành một mảng duy nhất và truyền cái đó; và 3) CALL DATE_PARSER một lần cho mỗi hàng bằng một hoặc nhiều chuỗi (tương ứng với các cột được xác định bởi parse_dates) làm đối số.

hàng ngàn, mặc định không cóstr, default None

Hàng ngàn phân tách để phân tích các cột chuỗi vào số. Lưu ý rằng tham số này chỉ cần thiết cho các cột được lưu trữ dưới dạng văn bản trong Excel, bất kỳ cột số nào sẽ tự động được phân tích cú pháp, bất kể định dạng hiển thị.

DecimalStr, mặc định ‘.str, default ‘.’

Ký tự để nhận ra là điểm thập phân để phân tích các cột chuỗi vào số. Lưu ý rằng tham số này chỉ cần thiết cho các cột được lưu trữ dưới dạng văn bản trong Excel, bất kỳ cột số nào sẽ tự động được phân tích cú pháp, bất kể định dạng hiển thị. (Ví dụ: sử dụng ‘, đối với dữ liệu châu Âu).

Mới trong phiên bản 1.4.0.

bình luận, không có mặc địnhstr, default None

Nhận xét ra phần còn lại của dòng. Chuyển một ký tự hoặc ký tự cho đối số này để chỉ ra nhận xét trong tệp đầu vào. Bất kỳ dữ liệu giữa chuỗi nhận xét và phần cuối của dòng hiện tại đều bị bỏ qua.

Skipfooterint, mặc định 0int, default 0

Hàng ở cuối để bỏ qua (0 chỉ số).

convert_floatbool, mặc định đúngbool, default True

Chuyển đổi phao tích phân sang int (tức là, 1.0 -> 1). Nếu sai, tất cả dữ liệu số sẽ được đọc dưới dạng phao: Excel lưu trữ tất cả các số dưới dạng nổi trong nội bộ.

Không dùngconvert_float will be removed in a future version

manggle_dupe_colsbool, mặc định đúngbool, default True

Các cột trùng lặp sẽ được chỉ định là ‘X,‘ X.1 ,, Truyền sai sẽ khiến dữ liệu bị ghi đè nếu có tên trùng lặp trong các cột.

Đã không dùng nữa kể từ phiên bản 1.5.0: Không được triển khai và một đối số mới để chỉ định mẫu cho tên của các cột trùng lặp sẽ được thêm vào thay thếNot implemented, and a new argument to specify the pattern for the names of duplicated columns will be added instead

Storage_OptionsDict, Tùy chọndict, optional

Các tùy chọn bổ sung có ý nghĩa cho một kết nối lưu trữ cụ thể, ví dụ: máy chủ, cổng, tên người dùng, mật khẩu, v.v. cho URL HTTP (s), các cặp giá trị khóa được chuyển tiếp đến

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
7 dưới dạng tùy chọn tiêu đề. Đối với các URL khác (ví dụ: bắt đầu với S3: //, và GC GCS: //), các cặp giá trị khóa được chuyển tiếp đến
>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
8. Vui lòng xem
>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0
9 và
>>> pd.read_excel('tmp.xlsx', index_col=0,
...               na_values=['string1', 'string2'])  
       Name  Value
0       NaN      1
1       NaN      2
2  #Comment      3
0 để biết thêm chi tiết và để biết thêm ví dụ về các tùy chọn lưu trữ, hãy tham khảo tại đây.

Mới trong phiên bản 1.2.0.

Trả về DataFrame hoặc Dict of DataFrames

DataFrame từ tệp được truyền trong tệp Excel. Xem Ghi chú trong Đối số Sheet_Name để biết thêm thông tin về khi nào một DID of DataFrames được trả về.

Xem thêm

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               na_values=['string1', 'string2'])  
       Name  Value
0       NaN      1
1       NaN      2
2  #Comment      3
1

Viết dataFrame vào một tệp excel.

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               na_values=['string1', 'string2'])  
       Name  Value
0       NaN      1
1       NaN      2
2  #Comment      3
2

Viết DataFrame vào tệp Giá trị được phân tách bằng dấu phẩy (CSV).

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               na_values=['string1', 'string2'])  
       Name  Value
0       NaN      1
1       NaN      2
2  #Comment      3
3

Đọc một tệp giá trị được phân tách bằng dấu phẩy (CSV) vào DataFrame.

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               na_values=['string1', 'string2'])  
       Name  Value
0       NaN      1
1       NaN      2
2  #Comment      3
4

Đọc một bảng các dòng định dạng chiều rộng cố định vào DataFrame.

Ví dụ

Tệp có thể được đọc bằng tên tệp dưới dạng chuỗi hoặc đối tượng tệp mở:

>>> pd.read_excel('tmp.xlsx', index_col=0)  
       Name  Value
0   string1      1
1   string2      2
2  #Comment      3

>>> pd.read_excel(open('tmp.xlsx', 'rb'),
...               sheet_name='Sheet3')  
   Unnamed: 0      Name  Value
0           0   string1      1
1           1   string2      2
2           2  #Comment      3

Chỉ mục và tiêu đề có thể được chỉ định thông qua các đối số index_col và tiêu đề

>>> pd.read_excel('tmp.xlsx', index_col=None, header=None)  
     0         1      2
0  NaN      Name  Value
1  0.0   string1      1
2  1.0   string2      2
3  2.0  #Comment      3

Các loại cột được suy ra nhưng có thể được chỉ định rõ ràng

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               dtype={'Name': str, 'Value': float})  
       Name  Value
0   string1    1.0
1   string2    2.0
2  #Comment    3.0

Đúng, các giá trị sai và NA và hàng ngàn phân tách có mặc định, nhưng cũng có thể được chỉ định rõ ràng. Cung cấp các giá trị bạn muốn là chuỗi hoặc danh sách các chuỗi!

>>> pd.read_excel('tmp.xlsx', index_col=0,
...               na_values=['string1', 'string2'])  
       Name  Value
0       NaN      1
1       NaN      2
2  #Comment      3

Có thể bỏ qua các dòng bình luận trong tệp đầu vào excel bằng cách sử dụng bình luận kwarg

>>> pd.read_excel('tmp.xlsx', index_col=0, comment='#')  
      Name  Value
0  string1    1.0
1  string2    2.0
2     None    NaN

Làm thế nào để pd read_excel hoạt động?

Để đọc một tệp excel dưới dạng dataFrame, hãy sử dụng phương thức pandas read_excel ().Bạn có thể đọc tờ đầu tiên, tờ cụ thể, nhiều tờ hoặc tất cả các tờ.Pandas chuyển đổi điều này thành cấu trúc DataFrame, là một cấu trúc giống như bảng.Pandas converts this to the DataFrame structure, which is a tabular like structure.

Read_excel trong gấu trúc là gì?

Các .Chức năng read_excel () có một đường dẫn đến tệp excel và đọc dữ liệu vào đối tượng DataFrame của gấu trúc.takes a path to an Excel file and reads the data into a Pandas DataFrame object.

DataFrame có tương tự như Excel Workbook không?

Khung dữ liệu.Một khung dữ liệu trong gấu trúc tương tự như bảng tính Excel.Trong khi một cuốn sách bài tập Excel có thể chứa nhiều bảng tính, Pandas DataFrame S tồn tại độc lập.A DataFrame in pandas is analogous to an Excel worksheet. While an Excel workbook can contain multiple worksheets, pandas DataFrame s exist independently.

Pandas read_excel có thể đọc CSV không?

Để đọc dữ liệu từ các tệp CSV hoặc Excel, bạn có thể sử dụng Thư viện Pandas.Hàm là read_csv () hoặc read_excel () từ gấu trúc.Bạn phải cung cấp đường dẫn tệp dưới dạng chuỗi.Đảm bảo tên tệp và phần mở rộng cũng được đưa ra trong đường dẫn.you can use pandas library. The function is read_csv() or read_excel() from pandas. You have to provide the file path as a string. Make sure the file name and extension is also given in the path.