Làm cách nào để mở và đọc tệp excel trong python?

Một tệp excel giả với. phần mở rộng xlsx sẽ được yêu cầu để kiểm tra các ví dụ của hướng dẫn này. Bạn có thể sử dụng bất kỳ tệp excel hiện có hoặc tạo một tệp mới. Ở đây, một tệp excel mới có tên là bán hàng. tệp xlsx đã được tạo với dữ liệu sau. Tệp này đã được sử dụng để đọc bằng cách sử dụng các mô-đun python khác nhau trong phần tiếp theo của hướng dẫn này

bán hàng. xlsx

Ngày bán hàngNgười bán hàngSố tiền12/05/18Sila Ahmed6000006/12/19Mir Hossain5000009/08/20Sarmin Jahan4500007/04/21Mahmudul Hasan30000

Ví dụ 1. Đọc file excel bằng xlrd

Mô-đun xlrd không được cài đặt với Python theo mặc định. Vì vậy, bạn phải cài đặt mô-đun trước khi sử dụng nó. Phiên bản mới nhất của mô-đun này không hỗ trợ tệp excel với. phần mở rộng xlsx. Vì vậy, bạn phải cài đặt 1. 2. 0 của mô-đun này để đọc tệp xlsx. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt phiên bản xlrd cần thiết

$ pip cài đặt xlrd==1. 2. 0

Sau khi hoàn tất quá trình cài đặt, hãy tạo tệp python với đoạn mã sau để đọc doanh số. xlsx bằng mô-đun xlrd. hàm open_workbook[] được sử dụng trong tập lệnh mở tệp xlsx để đọc. Tệp excel này chỉ chứa một trang tính. Vì vậy, sổ làm việc. hàm sheet_by_index[] đã được sử dụng trong tập lệnh với giá trị đối số là 0. Tiếp theo, vòng lặp 'for' lồng nhau đã được sử dụng để đọc các giá trị ô của trang tính bằng các giá trị hàng và cột. Hai hàm range[] đã được sử dụng trong tập lệnh để xác định kích thước hàng và cột dựa trên dữ liệu trang tính. Hàm cell_value[] đã được sử dụng để đọc giá trị ô cụ thể của trang tính trong mỗi lần lặp của vòng lặp. Mỗi trường trong đầu ra sẽ được phân tách bằng một dấu cách

# Nhập mô-đun xlrd
nhập xlrd

# Mở Sổ làm việc
workbook = xlrd.open_workbook["bán hàng. xlsx"]

# Mở trang tính
trang tính = workbook.sheet_by_index[0]

# .
for i in range[0, 5]:
    cho j trong phạm vi< . [0, 3]:
        # In giá trị ô bằng dấu cách
        in[worksheet.cell_value[ i , j ], end='\t']
    print['']

đầu ra

Đầu ra sau sẽ xuất hiện sau khi thực hiện đoạn mã trên

Ví dụ-2. Đọc tệp excel bằng openpyxl

Openpyxl là một mô-đun python khác để đọc tệp xlsx và nó cũng không được cài đặt với Python theo mặc định. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt mô-đun này trước khi sử dụng

$ pip cài đặt openpyxl

Sau khi hoàn tất quá trình cài đặt, hãy tạo tệp python với đoạn mã sau để đọc doanh số. tập tin xlsx. Giống như mô-đun xlrd, mô-đun openpyxl có chức năng load_workbook[] để mở tệp xlsx để đọc. bán hàng. tệp xlsx được sử dụng làm giá trị đối số của hàm này. Đối tượng của sổ làm việc. active đã được tạo trong tập lệnh để đọc các giá trị của thuộc tính max_row và max_column. Các thuộc tính này đã được sử dụng trong các vòng lặp lồng nhau để đọc nội dung của bán hàng. tập tin xlsx. Hàm range[] đã được sử dụng để đọc các hàng của trang tính và hàm iter_cols[] đã được sử dụng để đọc các cột của trang tính. Mỗi trường trong đầu ra sẽ được phân tách bằng hai dấu cách

# Nhập mô-đun openyxl
nhập openpyxl

# Xác định biến để tải sách giáo khoa
wookbook = openpyxl.load_workbook["bán hàng. xlsx"]

# Xác định biến để đọc trang tính đang hoạt động.
trang tính = sổ làm việc. hoạt động

# Lặp lại vòng lặp để đọc các giá trị ô
for i in range[0, worksheet.max_row] .
    cho col trong trang tính. iter_cols[1, trang tính. max_column] .
        in[ col [< . i].giá trị, kết thúc =" \t\t"]
    print['']

đầu ra

Đầu ra sau sẽ xuất hiện sau khi thực hiện đoạn mã trên

Ví dụ-3. Đọc file excel bằng pandas

Mô-đun pandas không được cài đặt với python giống như mô-đun trước đó. Vì vậy, nếu bạn chưa cài đặt nó trước đó, thì bạn phải cài đặt nó. Chạy lệnh sau để cài đặt gấu trúc từ thiết bị đầu cuối

$ pip cài đặt gấu trúc

Sau khi hoàn tất quá trình cài đặt, hãy tạo tệp python với đoạn mã sau để đọc doanh số. tập tin xlsx. Hàm read_excel[] của pandas được sử dụng để đọc tệp xlsx. Chức năng này đã được sử dụng trong tập lệnh để đọc doanh số bán hàng. tập tin xlsx. Hàm DataFrame[] đã được sử dụng ở đây để đọc nội dung của tệp xlsx trong khung dữ liệu và lưu trữ các giá trị trong biến có tên là dữ liệu. Giá trị của dữ liệu đã được in sau

# Nhập gấu trúc
nhập gấu trúc as pd . . . . . . . . . . . . . . . . . . . . . . . .

# Load the xlsx file
excel_data = pd.read_excel['bán hàng. xlsx']
# Đọc giá trị của tệp trong khung dữ liệu
dữ liệu . pd.DataFrame[ excel_data , cột . =[
                    'Sales Date', 'Sales Person', 'Amount']]
# Print the content
print["The content of the file is:\n ", dữ liệu ]

đầu ra

Đầu ra sau sẽ xuất hiện sau khi thực hiện đoạn mã trên. Đầu ra của tập lệnh này khác với hai ví dụ trước. Số hàng được in trong cột đầu tiên, trong đó giá trị hàng được tính từ 0. Các giá trị ngày được căn giữa. Tên của các nhân viên bán hàng được căn chỉnh bên phải. Số tiền được căn trái

Sự kết luận

Người dùng python cần làm việc với các tệp xlsx cho các mục đích lập trình khác nhau. Ba cách khác nhau để đọc tệp xlsx đã được trình bày trong hướng dẫn này bằng cách sử dụng ba mô-đun python. Mỗi mô-đun có các chức năng và thuộc tính khác nhau để đọc tệp xlsx. Hướng dẫn này sẽ giúp người dùng python đọc tệp xlsx dễ dàng bằng tập lệnh python sau khi đọc hướng dẫn này

Chủ Đề