Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel
import pandas as pd df = pd.read_excel[r'Path where the Excel file is stored\File name.xlsx'] print[df]
Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'
Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]
Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python
Dữ liệu được nhập vào Python
Giả sử rằng bạn có bảng sau được lưu trữ trong Excel [trong đó tên tệp Excel là 'sản phẩm']
product_namepricecomputer700tablet250printer120laptop1200keyboard100Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python
Các bước để nhập tệp Excel vào Python bằng Pandas
Bước 1. Chụp đường dẫn tập tin
Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn
Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau
C. \Users\Ron\Desktop\ sản phẩm. xlsx
Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn
Đừng quên bao gồm tên tệp [trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam]. Bạn cũng cần bao gồm phần mở rộng tệp Excel [trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục].
Bước 2. Áp dụng mã Python
Đây là mã Python cho ví dụ của chúng tôi
import pandas as pd df = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] print[df]
Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’
Bước 3. Chạy mã Python để nhập tệp Excel
Chạy mã Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được tập dữ liệu sau
product_name price
0 computer 700
1 tablet 250
2 printer 120
3 laptop 1200
4 keyboard 100
Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel
Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã
Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'
Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx
pip install openpyxl
Bước tùy chọn. Chọn tập hợp con của các cột
Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?
Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?
import pandas as pd data = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] df = pd.DataFrame[data, columns=['product_name']] print[df]
Chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được cột product_name
product_name
0 computer
1 tablet
2 printer
3 laptop
4 keyboard
Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này
import pandas as pd data = pd.read_excel[r'C:\Users\Ron\Desktop\products.xlsx'] df = pd.DataFrame[data, columns=['product_name', 'price']] print[df]
Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN
Phần kết luận
Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas
Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas
Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel
Đọc file Excel [phần mở rộng. xlsx,. xls] với Python Pandas. Để đọc tệp excel dưới dạng DataFrame, hãy sử dụng phương pháp pandas
12
2
3
4
5
Bạn có thể đọc trang đầu tiên, trang cụ thể, nhiều trang hoặc tất cả các trang. Pandas chuyển đổi cấu trúc này thành cấu trúc DataFrame, đây là cấu trúc dạng bảng
khóa học liên quan. Phân tích dữ liệu với Python Pandas
Excel
Trong bài viết này, chúng tôi sử dụng một tệp Excel ví dụ. Các chương trình chúng tôi sẽ thực hiện để đọc Excel thành Python
Tạo một file excel gồm 2 sheet sheet1 và sheet2. Bạn có thể sử dụng bất kỳ chương trình hỗ trợ Excel nào như Microsoft Excel hoặc Google Sheets
Nội dung của từng cái như sau
tờ1
tờ2
Cài đặt xlrd
gấu trúc. . read_excel một. ] sử dụng thư viện có tên xlrd trong nội bộ
xlrd là một thư viện để đọc [nhập] tệp Excel [. xlsx,. xls] bằng Python
bài viết liên quan. Cách dùng xlrd, xlwt đọc ghi file Excel bằng Python
Nếu bạn gọi gấu trúc. read_excel s[] trong môi trường chưa cài đặt xlrd, bạn sẽ nhận được thông báo lỗi tương tự như sau
Nhập Lỗi. Cài đặt xlrd >= 0. 9. 0 để được hỗ trợ Excel
xlrd có thể được cài đặt bằng pip. [pip3 tùy thuộc vào môi trường]
1
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]0
đọc excel
Chỉ định đường dẫn hoặc URL của tệp Excel trong đối số đầu tiên.
Nếu có nhiều trang tính, gấu trúc chỉ sử dụng trang tính đầu tiên.
Nó đọc là DataFrame.
1
2
3
4
5
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]2
Đoạn code trên xuất ra nội dung sheet excel
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]3____14
Nhận trang tính
Bạn có thể chỉ định trang tính để đọc với đối số sheet_name
Chỉ định theo số [bắt đầu từ 0]
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]5
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]6
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]3
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]8
Chỉ định theo tên trang tính
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]5
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]01____13
import pandas as pd df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name'] print[df]8
Tải nhiều tờ
Cũng có thể chỉ định một danh sách trong đối số sheet_name. Nó là OK ngay cả khi nó là một số 0 bắt đầu hoặc tên trang tính
Số hoặc tên trang tính được chỉ định là khóa chính và gấu trúc dữ liệu. DataFrame được đọc dưới dạng từ điển được đặt hàng OrderedDict với giá trị giá trị