Làm cách nào để chuyển đổi nhiều xlsx thành csv trong python?

Trong bài viết này, chúng ta sẽ xử lý việc chuyển đổi Excel [. xlsx] vào. csv. Có hai định dạng chủ yếu được sử dụng trong Excel
  1. [*. xlsx]. Tệp bảng tính định dạng Excel Microsoft Office Open XML
  2. [*. xls]. Bảng tính Excel [sổ làm việc Excel 97-2003]

Hãy xem xét một bộ dữ liệu của một cửa hàng mua sắm có dữ liệu về Số sê-ri khách hàng, Tên khách hàng, ID khách hàng và Giá thành sản phẩm được lưu trữ trong tệp Excel.  

kiểm tra tất cả các tập tin được sử dụng ở đây

Python3




# importing pandas as pd

import pandas as pd

 

# read an excel file and convert 

# into a dataframe object

df= pd.DataFrame[pd.read_excel["Test.xlsx"import0

 

import2

df

đầu ra.  

Bây giờ, hãy xem các cách khác nhau để chuyển đổi tệp Excel thành tệp CSV

Phương pháp 1. Chuyển đổi tệp Excel thành tệp CSV bằng thư viện pandas

Pandas là một thư viện phần mềm nguồn mở được xây dựng để thao tác và phân tích dữ liệu cho ngôn ngữ lập trình Python. Nó cung cấp nhiều chức năng khác nhau về cấu trúc dữ liệu và hoạt động để thao tác với các bảng số và chuỗi thời gian. Nó có thể đọc, lọc và sắp xếp lại các tập dữ liệu lớn và nhỏ, đồng thời xuất chúng ở nhiều định dạng bao gồm Excel, JSON, CSV

Để đọc tệp excel, sử dụng phương thức read_excel[] và chuyển đổi khung dữ liệu thành tệp CSV, hãy sử dụng phương thức to_csv[] của pandas

Mã số

Python3




import4

import pandas as pd

 

import8

import9

pandas as pd0= pandas as pd2"Test.xlsx"pandas as pd4

 

pandas as pd6

pandas as pd7

pandas as pd8pandas as pd9 0

 1_______3_______2=  4 5

 1_______3_______7= 9pandas as pd4

# read an excel file and convert 1

# read an excel file and convert 2

# into a dataframe object

df= # read an excel file and convert 6pandas as pd9import0

 

import2

df

đầu ra.  

 

Phương pháp 2. Chuyển đổi tệp Excel thành tệp CSV bằng thư viện xlrd và CSV

xlrd là thư viện với mục đích chính là đọc file excel.  

csv là một thư viện với mục đích chính là đọc và ghi tệp csv

Mã số

Python3




# into a dataframe object2

import # into a dataframe object4

import # into a dataframe object6

import pandas as pd

 

df0

df1

df2= df4_______9_______df6df7pandas as pd4

 

=0

=1_______7_______ =3=4=5=6 0

=8=9 0

=8pd.DataFrame[pd.read_excel[2=pd.DataFrame[pd.read_excel[4

 

pd.DataFrame[pd.read_excel[6

pd.DataFrame[pd.read_excel[7 pd.DataFrame[pd.read_excel[8_______8_______9 "Test.xlsx"0"Test.xlsx"1

"Test.xlsx"2"Test.xlsx"3

"Test.xlsx"2"Test.xlsx"5

"Test.xlsx"2"Test.xlsx"7

 

# read an excel file and convert 2

# into a dataframe object

df= # read an excel file and convert 6=6import0

 

import2

df

đầu ra.  

Phương pháp 3. Chuyển đổi tệp Excel thành tệp CSV bằng thư viện openpyxl và CSV

openpyxl là một thư viện để đọc/ghi các tệp Excel 2010 xlsx/xlsm/xltx/xltm. Nó được sinh ra từ việc thiếu thư viện hiện có để đọc/ghi nguyên bản từ Python định dạng Office Open XML

Chủ Đề