Pandas tạo file excel

Python, là một ngôn ngữ, có giá trị vượt trội, đặc biệt là khi bạn muốn làm việc với dữ liệu có cấu trúc. Vì mọi người lưu trữ nhiều dữ liệu trong file Excel nên bắt buộc phải hợp nhất nhiều file để tiết kiệm thời gian và công sức

Python cho phép bạn thực hiện điều đó. Bất kể bạn muốn kết hợp bao nhiêu tệp Excel, bạn đều có thể thực hiện một cách tương đối dễ dàng. Trong hướng dẫn này, bạn cần cài đặt và sử dụng thư viện Pandas để nhập dữ liệu vào Python trước khi hợp nhất nó

Cài đặt thư viện Pandas bằng Python

Pandas là thư viện của bên thứ ba mà bạn có thể cài đặt bằng Python. Một số IDE đã được cài đặt Pandas trong đó

Nếu bạn đang sử dụng phiên bản IDE không đi kèm với Pandas được cài đặt sẵn, hãy yên tâm, bạn có thể cài đặt trực tiếp bằng Python

Đây là cách cài đặt Pandas

pip install pandas

Nếu đang sử dụng Jupyter Notebook, bạn có thể cài đặt Pandas trực tiếp bằng lệnh PIP. Trong hầu hết mọi trường hợp, nếu đã cài đặt Jupyter với Anaconda, rất có thể bạn đã có sẵn Pandas để sử dụng trực tiếp

Nếu không thể gọi Pandas, bạn có thể sử dụng lệnh trên để cài đặt chúng trực tiếp

Kết hợp các tệp Excel với Python

Trước tiên, bạn cần tạo một thư mục ở vị trí ưa thích của mình với tất cả các tệp Excel. Khi thư mục đã có sẵn, bạn có thể bắt đầu viết mã để nhập các thư viện

Bạn sẽ sử dụng hai biến trong mã này

  • gấu trúc. Thư viện Pandas cung cấp các khung dữ liệu để lưu trữ các tệp Excel
  • hệ điều hành. Thư viện có lợi cho việc đọc dữ liệu từ thư mục trên máy của bạn

Để nhập các thư viện này, hãy sử dụng các lệnh sau

Import Pandas as pd  Import OS
  • Nhập khẩu. Cú pháp Python được sử dụng để nhập các thư viện trong Python
  • gấu trúc. Tên thư viện
  • pd. Bí danh được cấp cho thư viện
  • hệ điều hành. Một thư viện để truy cập vào thư mục hệ thống

Khi bạn đã nhập thư viện, hãy tạo hai biến để lưu trữ đường dẫn tệp đầu vào và đầu ra. Đường dẫn tệp đầu vào là thiết bị cần thiết để truy cập vào thư mục của tệp. Đường dẫn tệp đầu ra là cần thiết vì tệp kết hợp sẽ được xuất ở đó

Nếu bạn đang sử dụng Python, hãy chắc chắn rằng bạn đã thay đổi gạch chéo ngược thành gạch chéo ngược (\ thành /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"  output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Nối / vào cuối cũng để hoàn thành các đường dẫn

Các tập tin của thư mục có sẵn trong một danh sách. Tạo danh sách để lưu trữ tất cả các tệp tham chiếu của thư mục đầu vào bằng cách sử dụng hàm listdir từ hệ điều hành thư viện

Nếu bạn không chắc chắn về các chức năng có sẵn trong thư viện, bạn có thể sử dụng hàm dir với tên thư viện. Ví dụ, để kiểm tra phiên bản chính xác của hàm listdir, bạn có thể sử dụng lệnh như sau

dir(OS)

Đầu ra sẽ bao gồm tất cả các chức năng liên quan có sẵn trong hệ điều hành thư viện. Hàm listdir là một trong nhiều hàm có sẵn trong thư viện này

Tạo một biến mới để lưu trữ các tệp bắt đầu từ thư mục

excel_file_list = os.listdir(input_file_path)

Trong biến này để xem tên của các tệp được lưu trữ trong thư mục. Tất cả các tập tin lưu trữ trong thư mục được hiển thị khi bạn sử dụng hàm in

print (excel_file_list)

Tiếp theo, bạn cần thêm một khung dữ liệu mới để lưu trữ từng tệp Excel. Hãy tưởng tượng khung dữ liệu giống như một thùng chứa để lưu trữ dữ liệu. This is command to create data frame

df = pd.DataFrame()
  • df. Biến để lưu trữ giá trị của DataFrame
  • pd. Bí danh cho thư viện Pandas
  • Khung dữ liệu. Cú pháp mặc định để thêm khung dữ liệu

Đầu mục thư mục có 3 tệp. xlsx trong ví dụ này. file name is

File1_excel.xlsx  File2_excel.xlsx  File3_excel.xlsx

Pandas tạo file excel

Để mở từng tệp từ thư mục này, bạn cần chạy một vòng lặp. Vòng lặp sẽ chạy cho từng tệp trong danh sách đã tạo ở trên

Đây là cách bạn có thể làm điều đó

________số 8_______

Tiếp theo, cần kiểm tra phần mở rộng tệp vì mã sẽ chỉ mở tệp XLSX. Để kiểm tra các tập tin này, bạn có thể sử dụng câu lệnh If

Use function endwith for this target, as after

for excel_files in excel_file_list:      if excel_files.endswith(".xlsx"):
  • excel_files. Listing with all the value file
  • kết thúc với. Chức năng kiểm tra phần mở rộng tập tin
  • (“. xlsx"). Chuỗi giá trị này có thể thay đổi, tùy thuộc vào những gì bạn muốn tìm kiếm

Bây giờ, sau khi đã xác định được các tệp Excel, bạn có thể tạo một khung dữ liệu mới để đọc và lưu trữ các tệp riêng lẻ

Import Pandas as pd  Import OS
0
  • df1. Khung dữ liệu mới
  • pd. Thư viện Pandas
  • read_excel. Hàm đọc tệp Excel trong thư viện Pandas
  • input_file_path. Đường dẫn của thư mục nơi các tập tin được lưu trữ
  • excel_files. Bất kỳ biến nào được sử dụng trong vòng lặp cho

Để bắt đầu nối các tệp, bạn cần sử dụng hàm append

Import Pandas as pd  Import OS
1

Cuối cùng, bây giờ khung dữ liệu tổng hợp đã sẵn sàng, bạn có thể xuất nó sang vị trí đầu ra. Trong trường hợp này, bạn đang xuất khung dữ liệu sang tệp XLSX

Import Pandas as pd  Import OS
2
  • df. Data frame to export
  • to_excel. Dùng lệnh để xuất dữ liệu
  • đầu ra_file_path. Đường dẫn được xác định để lưu trữ đầu ra
  • Hợp nhất_file. xlsx. Tên của tập tin hợp nhất

Bây giờ, hãy xem mã cuối cùng

Import Pandas as pd  Import OS
3

Pandas tạo file excel

Pandas of Python là một công cụ tuyệt vời cho người mới bắt đầu cũng như người dùng nâng cao. Thư viện được sử dụng rộng rãi bởi các nhà phát triển muốn thành công với Python

Ngay cả khi là người mới bắt đầu, bạn có thể được hưởng lợi vô cùng lớn bằng cách khám phá các đặc điểm của Pandas và cách thư viện được sử dụng trong Python