Tệp CSV trong Python là gì?

Lần đầu tiên tôi bắt đầu làm việc với các tệp CSV khi học phần phụ trợ trong chương trình đào tạo bootcamp kỹ thuật phần mềm của mình. Mãi cho đến khi tôi bắt đầu đi sâu hơn vào phần khoa học dữ liệu trong quá trình học liên tục của mình, tôi mới bắt đầu sử dụng chúng một cách thường xuyên

CSV là viết tắt của các giá trị được phân tách bằng dấu phẩy và các tệp chứa tiện ích mở rộng

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
5 chứa một tập hợp các giá trị được phân tách bằng dấu phẩy được sử dụng để lưu trữ dữ liệu

Trong hướng dẫn này, chúng tôi sẽ sử dụng tập dữ liệu

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
6 công khai được lưu trữ trong tệp
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
7. Bạn có thể lấy tệp bằng cách tải xuống từ Kaggle, tuy nhiên, bạn sẽ có thể đọc bất kỳ tệp csv nào theo hướng dẫn bên dưới

Đọc tệp CSV bằng Python

Có hai cách phổ biến để đọc tệp

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
5 khi sử dụng Python. Đầu tiên bằng cách sử dụng thư viện
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9 và thứ hai bằng cách sử dụng thư viện
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
0

1. Sử dụng Thư viện CSV

import csv

with open["./bwq.csv", 'r'] as file:
  csvreader = csv.reader[file]
  for row in csvreader:
    print[row]

Ở đây chúng tôi đang nhập thư viện

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9 để sử dụng phương pháp
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
1 mà nó chứa để giúp chúng tôi đọc tệp
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9

Từ khóa

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
3 cho phép chúng tôi mở và đóng tệp mà không cần phải đóng tệp một cách rõ ràng

Phương thức

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
4 nhận hai đối số kiểu
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
5. Đầu tiên là tên tệp và thứ hai là đối số chế độ. Chúng tôi đang sử dụng
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
6 để đọc, tuy nhiên điều này có thể được bỏ qua vì
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
6 được mặc định

Sau đó chúng tôi lặp lại trên tất cả các hàng

Bạn sẽ mong đợi một đầu ra trong thiết bị đầu cuối trông giống như thế này

Đầu ra thiết bị đầu cuối Python

2. Sử dụng thư viện Pandas

import pandas as pd
data = pd.read_csv["bwq.csv"]
data

Ở đây chúng tôi đang nhập Pandas, một thư viện Python được sử dụng để tiến hành thao tác và phân tích dữ liệu. Nó chứa phương thức

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
8 mà chúng tôi cần để đọc tệp
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9 của chúng tôi

Bạn nên mong đợi đầu ra trông giống như thế này

Các vấn đề về dấu phân cách có thể xảy ra

Phần lớn các tệp

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9 được phân tách bằng dấu phẩy, tuy nhiên, có một số tệp được phân tách bằng các ký tự khác, chẳng hạn như dấu hai chấm, có thể tạo ra kết quả lạ trong Python

Giải pháp cho dấu phân cách bằng thư viện CSV

Để thay đổi dấu phân cách bằng thư viện

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9, chỉ cần chuyển đối số
import csv

with open["./fileWithColonDelimeter.csv", 'r'] as file:
  csvreader = csv.reader[file, delimiter=':']
  for row in csvreader:
    print[row]
2 trong phương thức
import csv

with open["./fileWithColonDelimeter.csv", 'r'] as file:
  csvreader = csv.reader[file, delimiter=':']
  for row in csvreader:
    print[row]
3 như vậy

import csv

with open["./fileWithColonDelimeter.csv", 'r'] as file:
  csvreader = csv.reader[file, delimiter=':']
  for row in csvreader:
    print[row]

Đối với các trường hợp cạnh khác khi đọc tệp

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9 bằng thư viện
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9, hãy xem trang này trong tài liệu Python

Giải pháp cho dấu phân cách bằng thư viện Pandas

Để thay đổi dấu phân cách bằng thư viện

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
0, chỉ cần chuyển đối số
import csv

with open["./fileWithColonDelimeter.csv", 'r'] as file:
  csvreader = csv.reader[file, delimiter=':']
  for row in csvreader:
    print[row]
2 trong phương thức
import csv

with open["./fileWithColonDelimeter.csv", 'r'] as file:
  csvreader = csv.reader[file, delimiter=':']
  for row in csvreader:
    print[row]
8 như vậy

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
4

Đối với các trường hợp cạnh khác khi đọc tệp

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9 bằng thư viện Pandas, hãy xem trang này tài liệu Pandas

Tiếp theo

Để có hướng dẫn chuyên sâu hơn về những gì bạn có thể làm sau khi đọc tệp

import pandas as pd
data = pd.read_csv["bwq.csv"]
data
9, hãy xem Lập biểu đồ lượng mưa bằng Python, Pandas và Matplotlib của Alex Couture-Beil

cái gì là. Tệp CSV dùng để làm gì?

CSV là tệp giá trị được phân tách bằng dấu phẩy, cho phép lưu dữ liệu ở định dạng bảng . CSV trông giống như một bảng tính đa dạng về vườn nhưng có. phần mở rộng csv. Các tệp CSV có thể được sử dụng với hầu hết mọi chương trình bảng tính, chẳng hạn như Microsoft Excel hoặc Bảng tính Google.

Làm cách nào để tạo tệp CSV bằng Python?

Ghi CSV vào Từ điển .
nhập csv
với mở ['trăn. csv', mode='w'] dưới dạng csv_file
tên trường = ['emp_name', 'dept', 'birth_month']
nhà văn = csv. DictWriter[csv_file, tên trường=tên trường]
nhà văn. đầu ghi[]
nhà văn. writerow[{'emp_name'. 'Parker', 'bộ phận'. 'Kế toán', 'tháng_sinh'. 'Tháng mười một'}]

Ví dụ về tệp CSV là gì?

Tệp CSV là danh sách dữ liệu được phân tách bằng dấu phẩy. Ví dụ, nó có thể trông giống như sau. Tên, email, số điện thoại, địa chỉ . Ví dụ,ví dụ@ví dụ. com,555-555-5555,Địa chỉ ví dụ .

Tệp CSV có phải là một loại chương trình Python không?

Tệp CSV [tệp Giá trị được phân tách bằng dấu phẩy] là một loại tệp văn bản thuần sử dụng cấu trúc cụ thể để sắp xếp dữ liệu dạng bảng . Bởi vì nó là một tệp văn bản thuần túy, nên nó chỉ có thể chứa dữ liệu văn bản thực—nói cách khác, các ký tự ASCII hoặc Unicode có thể in được. Cấu trúc của tệp CSV được đặt theo tên của nó.

Chủ Đề