Tách tệp csv thành nhiều tệp python pandas

Trong bài viết này, chúng ta sẽ tìm hiểu cách chia tệp CSV thành nhiều tệp trong Python. Chúng tôi sẽ sử dụng Pandas để tạo tệp CSV và chia thành nhiều tệp khác

Tạo tệp CSV bằng Python bằng Pandas

Để tạo CSV bằng Python bằng Pandas, trước tiên bắt buộc phải cài đặt Pandas thông qua Giao diện dòng lệnh [CLI]

pip install pandas

Lệnh này sẽ tải xuống và cài đặt Pandas vào máy cục bộ của bạn. Sử dụng từ khóa

The Version of Pandas is: 1.3.5
0, bạn có thể dễ dàng nhập nó vào chương trình Python hiện tại của mình

Hãy xác minh Pandas nếu nó được cài đặt hay không

Mã ví dụ

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]

đầu ra

The Version of Pandas is: 1.3.5

Bây giờ, hãy tạo một tệp

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
0

Ví dụ về mã

import pandas as pd

# create a data set
data_dict = {'Roll no':    [1, 2, 3, 4, 5, 6, 7, 8],

             'Gender': ["Male", "Female", "Female", "Male",
                        "Male", "Female", "Male", "Female"],

             'CGPA':       [3.5, 3.3, 2.7, 3.8, 2.4, 2.1, 2.9, 3.9],

             'English':     [76, 77, 85, 91, 49, 86, 66, 98],

             'Mathematics': [78, 87, 54, 65, 90, 59, 63, 89],

             'Programming': [99, 45, 68, 85, 60, 39, 55, 88]}

# create a data frame
data = pd.DataFrame[data_dict]

# convert the data frame into a csv file
data.to_csv["studesnts.csv"]

# Print the output
print[data]

đầu ra

   Roll no  Gender  CGPA  English  Mathematics  Programming
0        1    Male   3.5       76           78           99
1        2  Female   3.3       77           87           45
2        3  Female   2.7       85           54           68
3        4    Male   3.8       91           65           85
4        5    Male   2.4       49           90           60
5        6  Female   2.1       86           59           39
6        7    Male   2.9       66           63           55
7        8  Female   3.9       98           89           88

Tách tệp CSV thành nhiều tệp trong Python

Chúng tôi đã tạo thành công tệp

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
0. Hãy chia nó thành nhiều tệp, nhưng các ma trận khác nhau có thể được sử dụng để chia CSV trên cơ sở của các cột hoặc hàng

Tách tệp CSV dựa trên hàng

Hãy tách một tệp CSV trên cơ sở của các hàng trong Python

Mã ví dụ

import pandas as pd

# read DataFrame
data = pd.read_csv["students.csv"]

# number of csv files along with the row
k = 2
size = 4

for i in range[k]:
    df = data[size*i:size*[i+1]]

    df.to_csv[f'students{i+1}.csv', index=False]

file1 = pd.read_csv["students1.csv"]
print[file1]
print["\n"]
file2 = pd.read_csv["students2.csv"]
print[file2]

đầu ra

________số 8

Đoạn mã trên đã chia tệp

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
2 thành hai tệp,
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
3 và
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
4. Tệp được phân tách theo hàng;

Tách tệp CSV dựa trên cột

Chúng tôi có thể chia bất kỳ tệp CSV nào dựa trên ma trận cột với sự trợ giúp của hàm

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
7. Hàm
import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
7 thuộc thư viện Pandas và sử dụng dữ liệu nhóm

Trong trường hợp này, chúng tôi đang nhóm dữ liệu

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
9 dựa trên
The Version of Pandas is: 1.3.5
0

Ví dụ về mã

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
8

đầu ra

import pandas as pd
print["The Version of Pandas is: ", pd.__version__]
9

Sự kết luận

Tách dữ liệu là một kỹ thuật phân tích dữ liệu hữu ích giúp hiểu và sắp xếp dữ liệu hiệu quả

Trong bài viết này, chúng tôi đã thảo luận về cách tạo tệp CSV bằng thư viện Pandas. Ngoài ra, chúng ta đã thảo luận về hai kỹ thuật chia dữ liệu phổ biến, chia dữ liệu theo hàng và theo cột

Chủ Đề