Pandas tạo file excel
Python, là một ngôn ngữ, có giá trị vượt trội, đặc biệt là khi bạn muốn làm việc với dữ liệu có cấu trúc. Vì mọi người lưu trữ nhiều dữ liệu trong file Excel nên bắt buộc phải hợp nhất nhiều file để tiết kiệm thời gian và công sức Python cho phép bạn thực hiện điều đó. Bất kể bạn muốn kết hợp bao nhiêu tệp Excel, bạn đều có thể thực hiện một cách tương đối dễ dàng. Trong hướng dẫn này, bạn cần cài đặt và sử dụng thư viện Pandas để nhập dữ liệu vào Python trước khi hợp nhất nó Cài đặt thư viện Pandas bằng PythonPandas là thư viện của bên thứ ba mà bạn có thể cài đặt bằng Python. Một số IDE đã được cài đặt Pandas trong đó Nếu bạn đang sử dụng phiên bản IDE không đi kèm với Pandas được cài đặt sẵn, hãy yên tâm, bạn có thể cài đặt trực tiếp bằng Python Đây là cách cài đặt Pandas
Nếu đang sử dụng Jupyter Notebook, bạn có thể cài đặt Pandas trực tiếp bằng lệnh PIP. Trong hầu hết mọi trường hợp, nếu đã cài đặt Jupyter với Anaconda, rất có thể bạn đã có sẵn Pandas để sử dụng trực tiếp Nếu không thể gọi Pandas, bạn có thể sử dụng lệnh trên để cài đặt chúng trực tiếp Kết hợp các tệp Excel với PythonTrước tiên, bạn cần tạo một thư mục ở vị trí ưa thích của mình với tất cả các tệp Excel. Khi thư mục đã có sẵn, bạn có thể bắt đầu viết mã để nhập các thư viện Bạn sẽ sử dụng hai biến trong mã này
Để nhập các thư viện này, hãy sử dụng các lệnh sau
Khi bạn đã nhập thư viện, hãy tạo hai biến để lưu trữ đường dẫn tệp đầu vào và đầu ra. Đường dẫn tệp đầu vào là thiết bị cần thiết để truy cập vào thư mục của tệp. Đường dẫn tệp đầu ra là cần thiết vì tệp kết hợp sẽ được xuất ở đó Nếu bạn đang sử dụng Python, hãy chắc chắn rằng bạn đã thay đổi gạch chéo ngược thành gạch chéo ngược (\ thành /)
Nối / vào cuối cũng để hoàn thành các đường dẫn Các tập tin của thư mục có sẵn trong một danh sách. Tạo danh sách để lưu trữ tất cả các tệp tham chiếu của thư mục đầu vào bằng cách sử dụng hàm listdir từ hệ điều hành thư viện Nếu bạn không chắc chắn về các chức năng có sẵn trong thư viện, bạn có thể sử dụng hàm dir với tên thư viện. Ví dụ, để kiểm tra phiên bản chính xác của hàm listdir, bạn có thể sử dụng lệnh như sau
Đầu ra sẽ bao gồm tất cả các chức năng liên quan có sẵn trong hệ điều hành thư viện. Hàm listdir là một trong nhiều hàm có sẵn trong thư viện này Tạo một biến mới để lưu trữ các tệp bắt đầu từ thư mục
Trong biến này để xem tên của các tệp được lưu trữ trong thư mục. Tất cả các tập tin lưu trữ trong thư mục được hiển thị khi bạn sử dụng hàm in
Tiếp theo, bạn cần thêm một khung dữ liệu mới để lưu trữ từng tệp Excel. Hãy tưởng tượng khung dữ liệu giống như một thùng chứa để lưu trữ dữ liệu. This is command to create data frame
Đầu mục thư mục có 3 tệp. xlsx trong ví dụ này. file name is
Để mở từng tệp từ thư mục này, bạn cần chạy một vòng lặp. Vòng lặp sẽ chạy cho từng tệp trong danh sách đã tạo ở trên Đây là cách bạn có thể làm điều đó ________số 8_______Tiếp theo, cần kiểm tra phần mở rộng tệp vì mã sẽ chỉ mở tệp XLSX. Để kiểm tra các tập tin này, bạn có thể sử dụng câu lệnh If Use function endwith for this target, as after
Bây giờ, sau khi đã xác định được các tệp Excel, bạn có thể tạo một khung dữ liệu mới để đọc và lưu trữ các tệp riêng lẻ 0
Để bắt đầu nối các tệp, bạn cần sử dụng hàm append 1Cuối cùng, bây giờ khung dữ liệu tổng hợp đã sẵn sàng, bạn có thể xuất nó sang vị trí đầu ra. Trong trường hợp này, bạn đang xuất khung dữ liệu sang tệp XLSX 2
Bây giờ, hãy xem mã cuối cùng 3Pandas of Python là một công cụ tuyệt vời cho người mới bắt đầu cũng như người dùng nâng cao. Thư viện được sử dụng rộng rãi bởi các nhà phát triển muốn thành công với Python Ngay cả khi là người mới bắt đầu, bạn có thể được hưởng lợi vô cùng lớn bằng cách khám phá các đặc điểm của Pandas và cách thư viện được sử dụng trong Python |