Cách đọc tệp được phân tách bằng tab trong python pandas
Cách dễ nhất để chuyển đổi tệp giá trị được phân định bằng tab (TSV) thành tệp giá trị được phân tách bằng dấu phẩy (CSV) là sử dụng ba dòng mã sau Show
Tiếp theo, chúng tôi sẽ giải thích chi tiết hơn về phương pháp này và các phương pháp khác—hãy cuộn xuống Phương pháp 3 để biết phương pháp chính xác này Xây dựng vấn đềĐưa ra một tệp được phân định bằng tab có một ký tự tab 9 giữa hai giá trị trong một cột nhất địnhĐầu vào. 0 0 với các giá trị được phân tách bằng tab 9Alice DataScience $100000 Bob Programmer $90000 Carl Manager $122000 Dave Freelancer $144000 Làm cách nào để chuyển đổi các giá trị được phân định bằng tab (TSV) thành tệp giá trị được phân tách bằng dấu phẩy (CSV)? đầu ra. 2
Chúng tôi cũng sẽ xem xét các biến thể nhỏ của vấn đề này. Đi nào Phương pháp 1. Chuỗi thay thế một tabCách đơn giản nhất để chuyển đổi tệp được phân cách bằng tab (TSV) thành tệp được phân tách bằng dấu phẩy (CSV) trong Python là thay thế từng ký tự dạng bảng 9 bằng ký tự 4 bằng dấu phẩy bằng phương pháp 5. Điều này hoạt động nếu hai giá trị được phân tách bằng chính xác một ký tự dạng bảngĐây là một tệp đầu vào ví dụ 0Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân định bằng tab thành tệp CSV with open('my_file.tsv') as f: # Read space-delimited file and replace all empty spaces by commas data = f.read().replace('\t', ',') # Write the CSV data in the output file print(data, file=open('my_file.csv', 'w')) Tệp đầu ra 2Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi
Phương pháp 2. Regex Thay thế các tab tùy ýĐể thay thế một 9 hoặc nhiều tab with open('my_file.tsv') as f: # Read space-delimited file and replace all empty spaces by commas data = f.read().replace('\t', ',') # Write the CSV data in the output file print(data, file=open('my_file.csv', 'w'))2 giữa hai giá trị cột bằng dấu phẩy 4 và lấy CSV, hãy sử dụng thao tác biểu thức chính quy with open('my_file.tsv') as f: # Read space-delimited file and replace all empty spaces by commas data = f.read().replace('\t', ',') # Write the CSV data in the output file print(data, file=open('my_file.csv', 'w'))4 trên with open('my_file.tsv') as f: # Read space-delimited file and replace all empty spaces by commas data = f.read().replace('\t', ',') # Write the CSV data in the output file print(data, file=open('my_file.csv', 'w'))5 được phân tách bằng dấu cách Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi
Đây là một ví dụ về tệp đầu vào 0, lưu ý các ký tự dạng bảng bổ sung có thể phân tách hai giá trị cộtDưới đây là ví dụ về một số mã để chuyển đổi TSV thành tệp CSV 7Tệp đầu ra 2Phương pháp 3. Pandas read_csv() và to_csv()Để chuyển đổi tệp được phân định bằng tab thành CSV, trước tiên hãy đọc tệp đó vào Khung dữ liệu Pandas bằng cách sử dụng 71, sau đó ghi Khung dữ liệu vào tệp bằng cách sử dụng 72Đây là một tệp đầu vào ví dụ 0Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân định bằng tab thành tệp CSV 1Tệp đầu ra 2Bạn cũng có thể sử dụng 75 đơn giản hơn nếu bạn chắc chắn rằng chỉ một ký tự dạng bảng đơn lẻ phân tách hai giá trị cộtNếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi
Tóm lượcChúng tôi đã kiểm tra ba cách tuyệt vời để chuyển đổi tệp CSV được phân cách bằng dấu cách thành tệp CSV được phân tách bằng dấu phẩy Cảm ơn đã dành thời gian để đọc bài viết này, bạn của tôi. 🐍💛 Regex hài hướcChris Trong khi làm việc với tư cách là một nhà nghiên cứu trong các hệ thống phân tán, Dr. Christian Mayer tìm thấy tình yêu của mình với việc dạy sinh viên khoa học máy tính Để giúp sinh viên đạt được mức độ thành công Python cao hơn, anh ấy đã thành lập trang web giáo dục lập trình Finxter. com. Ông là tác giả của cuốn sách lập trình nổi tiếng Python One-Liners (NoStarch 2020), đồng tác giả của loạt sách tự xuất bản Coffee Break Python, người đam mê khoa học máy tính, cộng tác viên tự do và chủ sở hữu của một trong 10 blog Python lớn nhất thế giới Niềm đam mê của anh ấy là viết, đọc và mã hóa. Nhưng niềm đam mê lớn nhất của anh ấy là phục vụ các lập trình viên đầy tham vọng thông qua Finxter và giúp họ nâng cao kỹ năng của mình. Bạn có thể tham gia học viện email miễn phí của anh ấy tại đây Làm cách nào để đọc tệp được phân tách bằng tab trong Python bằng gấu trúc?Để đọc tệp TSV có dấu phân cách tab (\t) hãy sử dụng hàm pandas read_table() . Điều này cũng hỗ trợ tùy chọn lặp lại hoặc chia tệp thành nhiều phần.
Làm cách nào để đọc tệp văn bản được phân tách trong gấu trúc?Sử dụng read_csv()
tiện ích mở rộng csv . Để đọc tệp văn bản của chúng tôi và tải nó vào DataFrame của gấu trúc, tất cả những gì chúng tôi cần cung cấp cho phương thức read_csv() là tên tệp, dấu phân cách/dấu phân cách (trong trường hợp của chúng tôi là khoảng trắng) và hàng chứa tên cột mà .
Cách đọc tệp CSV được phân tách bằng dấu phẩy trong pandas?Các bước để đọc tệp CSV. . Nhập thư viện csv. nhập csv Mở tệp CSV. Các. . Sử dụng tệp csv. đối tượng reader để đọc tệp CSV. csvreader = csv. người đọc (tập tin) Trích xuất tên trường. Tạo một danh sách trống gọi là tiêu đề. . Trích xuất các hàng/bản ghi. . Đóng tệp |