Trong bài viết này, chúng ta sẽ tìm hiểu cách chia tệp CSV thành nhiều tệp trong Python. Chúng tôi sẽ sử dụng Pandas để tạo tệp CSV và chia thành nhiều tệp khác
Tạo tệp CSV bằng Python bằng Pandas
Để tạo CSV bằng Python bằng Pandas, trước tiên bắt buộc phải cài đặt Pandas thông qua Giao diện dòng lệnh [CLI]
pip install pandas
Lệnh này sẽ tải xuống và cài đặt Pandas vào máy cục bộ của bạn. Sử dụng từ khóa
The Version of Pandas is: 1.3.5
0, bạn có thể dễ dàng nhập nó vào chương trình Python hiện tại của mìnhHãy xác minh Pandas nếu nó được cài đặt hay không
Mã ví dụ
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
đầu ra
The Version of Pandas is: 1.3.5
Bây giờ, hãy tạo một tệp
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
0Ví dụ về mã
import pandas as pd
# create a data set
data_dict = {'Roll no': [1, 2, 3, 4, 5, 6, 7, 8],
'Gender': ["Male", "Female", "Female", "Male",
"Male", "Female", "Male", "Female"],
'CGPA': [3.5, 3.3, 2.7, 3.8, 2.4, 2.1, 2.9, 3.9],
'English': [76, 77, 85, 91, 49, 86, 66, 98],
'Mathematics': [78, 87, 54, 65, 90, 59, 63, 89],
'Programming': [99, 45, 68, 85, 60, 39, 55, 88]}
# create a data frame
data = pd.DataFrame[data_dict]
# convert the data frame into a csv file
data.to_csv["studesnts.csv"]
# Print the output
print[data]
đầu ra
Roll no Gender CGPA English Mathematics Programming
0 1 Male 3.5 76 78 99
1 2 Female 3.3 77 87 45
2 3 Female 2.7 85 54 68
3 4 Male 3.8 91 65 85
4 5 Male 2.4 49 90 60
5 6 Female 2.1 86 59 39
6 7 Male 2.9 66 63 55
7 8 Female 3.9 98 89 88
Tách tệp CSV thành nhiều tệp trong Python
Chúng tôi đã tạo thành công tệp
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
0. Hãy chia nó thành nhiều tệp, nhưng các ma trận khác nhau có thể được sử dụng để chia CSV trên cơ sở của các cột hoặc hàngTách tệp CSV dựa trên hàng
Hãy tách một tệp CSV trên cơ sở của các hàng trong Python
Mã ví dụ
import pandas as pd
# read DataFrame
data = pd.read_csv["students.csv"]
# number of csv files along with the row
k = 2
size = 4
for i in range[k]:
df = data[size*i:size*[i+1]]
df.to_csv[f'students{i+1}.csv', index=False]
file1 = pd.read_csv["students1.csv"]
print[file1]
print["\n"]
file2 = pd.read_csv["students2.csv"]
print[file2]
đầu ra
________số 8Đoạn mã trên đã chia tệp
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
2 thành hai tệp, import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
3 và import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
4. Tệp được phân tách theo hàng; Tách tệp CSV dựa trên cột
Chúng tôi có thể chia bất kỳ tệp CSV nào dựa trên ma trận cột với sự trợ giúp của hàm
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
7. Hàm import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
7 thuộc thư viện Pandas và sử dụng dữ liệu nhómTrong trường hợp này, chúng tôi đang nhóm dữ liệu
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
9 dựa trên The Version of Pandas is: 1.3.5
0Ví dụ về mã
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
8đầu ra
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
9Sự kết luận
Tách dữ liệu là một kỹ thuật phân tích dữ liệu hữu ích giúp hiểu và sắp xếp dữ liệu hiệu quả
Trong bài viết này, chúng tôi đã thảo luận về cách tạo tệp CSV bằng thư viện Pandas. Ngoài ra, chúng ta đã thảo luận về hai kỹ thuật chia dữ liệu phổ biến, chia dữ liệu theo hàng và theo cột