- [*. xlsx]. Tệp bảng tính định dạng Excel Microsoft Office Open XML
- [*. xls]. Bảng tính Excel [sổ làm việc Excel 97-2003]
Hãy xem xét một bộ dữ liệu của một cửa hàng mua sắm có dữ liệu về Số sê-ri khách hàng, Tên khách hàng, ID khách hàng và Giá thành sản phẩm được lưu trữ trong tệp Excel.
kiểm tra tất cả các tập tin được sử dụng ở đây
Python3
# importing pandas as pd
import
pandas as pd
# read an excel file and convert
# into a dataframe object
df
=
pd.DataFrame[pd.read_excel[
"Test.xlsx"
import
0
import
2
df
đầu ra.
Bây giờ, hãy xem các cách khác nhau để chuyển đổi tệp Excel thành tệp CSV
Phương pháp 1. Chuyển đổi tệp Excel thành tệp CSV bằng thư viện pandas
Pandas là một thư viện phần mềm nguồn mở được xây dựng để thao tác và phân tích dữ liệu cho ngôn ngữ lập trình Python. Nó cung cấp nhiều chức năng khác nhau về cấu trúc dữ liệu và hoạt động để thao tác với các bảng số và chuỗi thời gian. Nó có thể đọc, lọc và sắp xếp lại các tập dữ liệu lớn và nhỏ, đồng thời xuất chúng ở nhiều định dạng bao gồm Excel, JSON, CSV
Để đọc tệp excel, sử dụng phương thức read_excel[] và chuyển đổi khung dữ liệu thành tệp CSV, hãy sử dụng phương thức to_csv[] của pandas
Mã số
Python3
import
4
import
pandas as pd
import
8
import
9
pandas as pd
0=
pandas as pd
2"Test.xlsx"
pandas as pd
4
pandas as pd
6
pandas as pd
7
pandas as pd
8pandas as pd
9
0
1_______3_______2=
4
5
1_______3_______7=
9pandas as pd
4
# read an excel file and convert
1
# read an excel file and convert
2
# into a dataframe object
df
=
# read an excel file and convert
6pandas as pd
9import
0
import
2
df
đầu ra.
Phương pháp 2. Chuyển đổi tệp Excel thành tệp CSV bằng thư viện xlrd và CSV
xlrd là thư viện với mục đích chính là đọc file excel.
csv là một thư viện với mục đích chính là đọc và ghi tệp csv
Mã số
Python3
# into a dataframe object
2
import
# into a dataframe object
4
import
# into a dataframe object
6
import
pandas as pd
df
0
df
1
df
2=
df
4_______9_______df
6df
7pandas as pd
4
=
0
=
1_______7_______ =
3=
4=
5=
6
0
=
8=
9
0
=
8pd.DataFrame[pd.read_excel[
2=
pd.DataFrame[pd.read_excel[
4
pd.DataFrame[pd.read_excel[
6
pd.DataFrame[pd.read_excel[
7 pd.DataFrame[pd.read_excel[
8_______8_______9 "Test.xlsx"
0"Test.xlsx"
1
"Test.xlsx"
2"Test.xlsx"
3
"Test.xlsx"
2"Test.xlsx"
5
"Test.xlsx"
2"Test.xlsx"
7
# read an excel file and convert
2
# into a dataframe object
df
=
# read an excel file and convert
6=
6import
0
import
2
df
đầu ra.
Phương pháp 3. Chuyển đổi tệp Excel thành tệp CSV bằng thư viện openpyxl và CSV
openpyxl là một thư viện để đọc/ghi các tệp Excel 2010 xlsx/xlsm/xltx/xltm. Nó được sinh ra từ việc thiếu thư viện hiện có để đọc/ghi nguyên bản từ Python định dạng Office Open XML