Gấu trúc đọc các hàng cụ thể của excel

nhập sổ làm việc xlsxwriter = xlsxwriter. Sổ làm việc ('write_list. xlsx') trang tính = sổ làm việc. add_worksheet() my_list = [[1, 1, 1, 1, 1], [2, 2, 2, 2, 1], [3, 3, 3, 3, 1], [4, 4, 4, 4 . cho col_num, col_data trong liệt kê (row_data). bảng tính. sổ làm việc write(row_num, col_num, col_data). gần()

Trước khi đọc một file excel trong pandas, chúng ta cần cài đặt thư viện openpyxl. Đây là thư viện phụ thuộc cần thiết để đọc và ghi tệp excel trong pandas

Trong Terminal trên Mac hoặc Dòng lệnh trong windows, trước tiên hãy chạy lệnh sau

pip install openpyxl

Và trong bài đăng này, chúng tôi sẽ làm việc với tệp mẫu này mà bạn có thể tải xuống từ đây – liên kết tải xuống dữ liệu

Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

Ở đây, chúng tôi có một số dữ liệu bán hàng trong nhiều trang tính và chúng tôi muốn đọc những dữ liệu này bằng pandas. hãy xem làm thế nào để làm điều đó

Đầu tiên để lấy tên của tất cả các sheet trong file excel ta có thể sử dụng lệnh pd. Tệp Excel()

sheets_names = pd.ExcelFile('reading_excel_file.xlsx').sheet_names
sheets_names
Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

giả sử chúng ta muốn đọc dữ liệu Đơn đặt hàng 1. Để làm điều đó, chúng ta cần chuyển tên trang tính cho tham số sheet_name trong pandas.

df = pd.read_excel('reading_excel_file.xlsx', sheet_name='Purchase Orders 1')
Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

2. Cách bỏ qua hàng khi đọc tệp excel trong pandas

Nếu bạn muốn bỏ qua số n hàng từ trên xuống, bạn cần sử dụng tham số bỏ qua

Giả sử chúng ta muốn bỏ qua 2 hàng đầu tiên khi đọc tệp

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  skiprows=2)
Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

Chúng ta có thể thấy rằng hai hàng trên cùng đã bị bỏ qua khỏi kết quả.

Và nếu bạn muốn bỏ qua n hàng từ cuối, bạn có thể sử dụng tham số skipfooter

Giả sử chúng ta muốn bỏ qua 3 hàng từ cuối

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  skipfooter=3)
Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

3. Cách bỏ qua các cột khi đọc tệp excel trong gấu trúc.

Để bỏ cột khi đọc file excel, bạn có thể sử dụng tham số usecols của read_excel

Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

giả sử tôi chỉ quan tâm đến việc đọc các cột từ ID sản phẩm đến Số lượng đặt hàng

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  usecols='C:F')
Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

Bây giờ, giả sử bạn muốn chọn hai cột đầu tiên và hai cột cuối cùng. Để làm điều đó, bạn sẽ viết

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  usecols='A:B, H:I')
Gấu trúc đọc các hàng cụ thể của excel
Gấu trúc đọc các hàng cụ thể của excel

4. Cách đọc tệp excel trong gấu trúc có tiêu đề

Đôi khi có thể xảy ra trường hợp dữ liệu mà bạn muốn làm việc không bắt đầu từ hàng đầu tiên. Hãy sao chép dữ liệu bán hàng sang một tệp excel mới và thêm một số dòng trống trước dữ liệu để chứng minh rằng

Bây giờ, nếu bạn nhìn vào hình bên dưới, bạn có thể thấy rằng dữ liệu không bắt đầu từ hàng đầu tiên. Có rất nhiều hàng trống mà gấu trúc điền vào NaN (Không phải là số) và tên cột cũng được đặt tên là Chưa đặt tên

Làm thế nào gấu trúc đọc các ô cụ thể trong Excel?

Cách đọc một giá trị từ XLS(X) bằng pandas .
Bài kiểm tra. .
bỏ qua = 2. Số hàng trừ đi một, vì vậy hàng mong muốn là hàng đầu tiên chúng tôi đọc
sử dụngcols="C". Những cột nào chúng tôi quan tâm – chỉ một
mũi tên = 1. Chỉ đọc một hàng
tiêu đề = Không có. Đừng cho rằng hàng đầu tiên chúng ta đọc là hàng tiêu đề

Cách hiển thị các hàng và cột cụ thể trong gấu trúc?

Để chọn một số hàng và cột cụ thể, bạn có thể thực hiện các thao tác sau bằng cách sử dụng. lộc . Để chọn một giá trị từ DataFrame, bạn có thể làm như sau. Bạn có thể sử dụng cắt để chọn một cột cụ thể.