Cách đọc tệp được phân tách bằng tab trong python pandas

Cách dễ nhất để chuyển đổi tệp giá trị được phân định bằng tab [TSV] thành tệp giá trị được phân tách bằng dấu phẩy [CSV] là sử dụng ba dòng mã sau

  1. 0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    6
  2. 0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    7
  3. 0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    8

Tiếp theo, chúng tôi sẽ giải thích chi tiết hơn về phương pháp này và các phương pháp khác—hãy cuộn xuống Phương pháp 3 để biết phương pháp chính xác này

Xây dựng vấn đề

Đưa ra một tệp được phân định bằng tab có một ký tự tab

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
9 giữa hai giá trị trong một cột nhất định

Đầu vào.

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
0

Nhân vật. Tệp
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
0 với các giá trị được phân tách bằng tab
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
9

Alice	DataScience	$100000
Bob	Programmer	$90000
Carl	Manager	$122000
Dave	Freelancer	$144000

Làm cách nào để chuyển đổi các giá trị được phân định bằng tab [TSV] thành tệp giá trị được phân tách bằng dấu phẩy [CSV]?

đầu ra.

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
2

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000

Chúng tôi cũng sẽ xem xét các biến thể nhỏ của vấn đề này. Đi nào

Phương pháp 1. Chuỗi thay thế một tab

Cách đơn giản nhất để chuyển đổi tệp được phân cách bằng tab [TSV] thành tệp được phân tách bằng dấu phẩy [CSV] trong Python là thay thế từng ký tự dạng bảng

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
9 bằng ký tự
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4 bằng dấu phẩy bằng phương pháp
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
5. Điều này hoạt động nếu hai giá trị được phân tách bằng chính xác một ký tự dạng bảng

Đây là một tệp đầu vào ví dụ

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
0

Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân định bằng tab thành tệp CSV

with open['my_file.tsv'] as f:

    # Read space-delimited file and replace all empty spaces by commas
    data = f.read[].replace['\t', ',']

    # Write the CSV data in the output file
    print[data, file=open['my_file.csv', 'w']]

Tệp đầu ra

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
2

Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi

  • Phương thức thay thế chuỗi Python
  • Hàm
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    8 của Python
  • Python
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    9 vào tệp
  • Hàm
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    9 của Python
  • Trình quản lý bối cảnh Python

Phương pháp 2. Regex Thay thế các tab tùy ý

Để thay thế một

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
9 hoặc nhiều tab
with open['my_file.tsv'] as f:

    # Read space-delimited file and replace all empty spaces by commas
    data = f.read[].replace['\t', ',']

    # Write the CSV data in the output file
    print[data, file=open['my_file.csv', 'w']]
2 giữa hai giá trị cột bằng dấu phẩy
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4 và lấy CSV, hãy sử dụng thao tác biểu thức chính quy
with open['my_file.tsv'] as f:

    # Read space-delimited file and replace all empty spaces by commas
    data = f.read[].replace['\t', ',']

    # Write the CSV data in the output file
    print[data, file=open['my_file.csv', 'w']]
4 trên
with open['my_file.tsv'] as f:

    # Read space-delimited file and replace all empty spaces by commas
    data = f.read[].replace['\t', ',']

    # Write the CSV data in the output file
    print[data, file=open['my_file.csv', 'w']]
5 được phân tách bằng dấu cách

Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi

  • Python Regex
    with open['my_file.tsv'] as f:
    
        # Read space-delimited file and replace all empty spaces by commas
        data = f.read[].replace['\t', ',']
    
        # Write the CSV data in the output file
        print[data, file=open['my_file.csv', 'w']]
    6
  • Python Regex
    with open['my_file.tsv'] as f:
    
        # Read space-delimited file and replace all empty spaces by commas
        data = f.read[].replace['\t', ',']
    
        # Write the CSV data in the output file
        print[data, file=open['my_file.csv', 'w']]
    7 Lớp ký tự
  • Bộ định lượng Python Regex
    with open['my_file.tsv'] as f:
    
        # Read space-delimited file and replace all empty spaces by commas
        data = f.read[].replace['\t', ',']
    
        # Write the CSV data in the output file
        print[data, file=open['my_file.csv', 'w']]
    8
  • Siêu năng lực Regex của Python

Đây là một ví dụ về tệp đầu vào

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
0, lưu ý các ký tự dạng bảng bổ sung có thể phân tách hai giá trị cột

Dưới đây là ví dụ về một số mã để chuyển đổi TSV thành tệp CSV

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
7

Tệp đầu ra

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
2

Phương pháp 3. Pandas read_csv[] và to_csv[]

Để chuyển đổi tệp được phân định bằng tab thành CSV, trước tiên hãy đọc tệp đó vào Khung dữ liệu Pandas bằng cách sử dụng

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
71, sau đó ghi Khung dữ liệu vào tệp bằng cách sử dụng
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
72

Đây là một tệp đầu vào ví dụ

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
0

Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân định bằng tab thành tệp CSV

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
1

Tệp đầu ra

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
2

Bạn cũng có thể sử dụng

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
75 đơn giản hơn nếu bạn chắc chắn rằng chỉ một ký tự dạng bảng đơn lẻ phân tách hai giá trị cột

Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi

  • Gấu trúc
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    76
  • Gấu trúc
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    77

Tóm lược

Chúng tôi đã kiểm tra ba cách tuyệt vời để chuyển đổi tệp CSV được phân cách bằng dấu cách thành tệp CSV được phân tách bằng dấu phẩy

Cảm ơn đã dành thời gian để đọc bài viết này, bạn của tôi. 🐍💛

Regex hài hước

Đợi đã, quên thoát khỏi một không gian. Weeeeee[taptaptap]eeeeee. [nguồn]

Chris

Trong khi làm việc với tư cách là một nhà nghiên cứu trong các hệ thống phân tán, Dr. Christian Mayer tìm thấy tình yêu của mình với việc dạy sinh viên khoa học máy tính

Để giúp sinh viên đạt được mức độ thành công Python cao hơn, anh ấy đã thành lập trang web giáo dục lập trình Finxter. com. Ông là tác giả của cuốn sách lập trình nổi tiếng Python One-Liners [NoStarch 2020], đồng tác giả của loạt sách tự xuất bản Coffee Break Python, người đam mê khoa học máy tính, cộng tác viên tự do và chủ sở hữu của một trong 10 blog Python lớn nhất thế giới

Niềm đam mê của anh ấy là viết, đọc và mã hóa. Nhưng niềm đam mê lớn nhất của anh ấy là phục vụ các lập trình viên đầy tham vọng thông qua Finxter và giúp họ nâng cao kỹ năng của mình. Bạn có thể tham gia học viện email miễn phí của anh ấy tại đây

Làm cách nào để đọc tệp được phân tách bằng tab trong Python bằng gấu trúc?

Để đọc tệp TSV có dấu phân cách tab [\t] hãy sử dụng hàm pandas read_table[] . Điều này cũng hỗ trợ tùy chọn lặp lại hoặc chia tệp thành nhiều phần.

Làm cách nào để đọc tệp văn bản được phân tách trong gấu trúc?

Sử dụng read_csv[] tiện ích mở rộng csv . Để đọc tệp văn bản của chúng tôi và tải nó vào DataFrame của gấu trúc, tất cả những gì chúng tôi cần cung cấp cho phương thức read_csv[] là tên tệp, dấu phân cách/dấu phân cách [trong trường hợp của chúng tôi là khoảng trắng] và hàng chứa tên cột mà .

Cách đọc tệp CSV được phân tách bằng dấu phẩy trong pandas?

Các bước để đọc tệp CSV. .
Nhập thư viện csv. nhập csv
Mở tệp CSV. Các. .
Sử dụng tệp csv. đối tượng reader để đọc tệp CSV. csvreader = csv. người đọc [tập tin]
Trích xuất tên trường. Tạo một danh sách trống gọi là tiêu đề. .
Trích xuất các hàng/bản ghi. .
Đóng tệp

Chủ Đề