Trăn tách dải

Python là một trong những ngôn ngữ lập trình biến phổ biến nhất trên thế giới. Một lý do cho sự phổ biến của nó là Python giúp bạn dễ dàng làm việc với dữ liệu

Nội dung chính Hiển thị

Đọc dữ liệu từ tệp văn bản là một nhiệm vụ thường xuyên trong Python. Trong bài đăng này, chúng tôi sẽ xem xét cách đọc nhanh nhất và chia sẻ tệp văn bản bằng Python. Chia dữ liệu sẽ chuyển đổi văn bản thành một danh sách, giúp làm việc dễ dàng hơn

Chúng tôi cũng sẽ bao gồm một số phương thức khác để chia sẻ các tệp văn bản trong Python và giải thích cách thức cũng như khi bất kỳ phương pháp nào hữu ích

Trong các ví dụ sau, chúng tôi sẽ thấy Python có thể giúp chúng tôi làm chủ dữ liệu văn bản như thế nào. Tận dụng lợi thế của Python, nhiều chức năng phân tích hợp nhất sẽ đơn giản hóa các nhiệm vụ của chúng tôi

Giới thiệu phương thức Split []

Cách nhanh nhất để chia văn bản trong Python là với phương thức Split[]. Đây là một phương pháp phân tích hợp hữu ích để tách một chuỗi thành các phần riêng lẻ của nó. phương pháp tách []. Đây là một phương thức tích hợp hữu ích để tách một chuỗi thành các phần riêng lẻ của nó

Phương thức chia [] sẽ trả về một danh sách các phần tử trong một chuỗi. Theo mặc định, Python sử dụng khoảng trắng để phân chia chuỗi, nhưng bạn có thể cung cấp một dấu cách và chỉ định [các] ký tự nào sẽ sử dụng thay thế

Ví dụ. dấu phẩy [,] thường được sử dụng để phân tách chuỗi dữ liệu. Đây là trường hợp với các giá trị phân tách tệp giá trị [CSV]. Bất kể điều gì bạn chọn làm dấu phân cách, Python sẽ sử dụng để phân chuỗi

Tách tệp văn bản với phương thức chia []

Trong ví dụ đầu tiên của chúng tôi, chúng tôi có một tệp văn bản của nhân viên dữ liệu, bao gồm tên của nhân viên, số điện thoại và nghề nghiệp của họ

Chúng tôi phải viết một chương trình Python có thể đọc thông tin được tạo ngẫu nhiên này và chia dữ liệu thành danh sách

leadyee_data. txtlana Anderson 485-3094-88 Thợ điện Johnston 751-5845-87 Thiết kế nội thất -01 Nhà thiết kế nội thất
Lana Anderson 485-3094-88 Thợ điện
Elian Johnston 751-5845-87 Interior Designer
Henry Johnston 777-6561-52 Astronomer
Dale Johnston 248-1843-09 Journalist
Luke Owens 341-7471-63 Teacher
Amy Perry 494-3532-17 Electrician
Chloe Baker 588-7165-01 Interior Designer

Sau khi sử dụng python với câu lệnh để mở tệp dữ liệu, chúng ta có thể lặp lại thông tin qua nội dung của tệp bằng một vòng lặp. Khi dữ liệu được đọc, phương thức chia [] được sử dụng để tách văn bản thành các từ. với câu lệnh mở tệp dữ liệu, chúng ta có thể lặp qua nội dung của tệp bằng vòng lặp for. Khi dữ liệu được đọc, phương thức split[] được sử dụng để tách văn bản thành các từ

Trong trường hợp của chúng tôi, văn bản được phân tách bằng khoảng trống, đây là hành vi mặc định của phương thức chia []

Ví dụ 1. Tách nhân viên dữ liệu với Python

with open["employee_data.txt",'r'] as data_file:
    for line in data_file:
        data = line.split[]
        print[data]

đầu ra

['Lana', 'Anderson', '485-3094-88', 'Electrician']
['Elian', 'Johnston', '751-5845-87', 'Interior', 'Designer']
['Henry', 'Johnston', '777-6561-52', 'Astronomer']
['Dale', 'Johnston', '248-1843-09', 'Journalist']
['Luke', 'Owens', '341-7471-63', 'Teacher']
['Amy', 'Perry', '494-3532-17', 'Electrician']
['Chloe', 'Baker', '588-7165-01', 'Interior', 'Designer']

Share the wire with comcom

Chúng tôi cung cấp một tùy chọn phân tách cho phương thức chia [] để chỉ định bất kỳ ký tự nào để phân chia chuỗi với chuỗi. Default partition is void

Trong ví dụ tiếp theo, chúng tôi sẽ sử dụng dấu phẩy để phân chia dữ liệu điểm kiểm tra được đọc từ một tệp

điểm. txtJanet,100,50,69Thomas,99,76,100Kate,102,78,65
Janet,100,50,69
Thomas,99,76,100

Chủ Đề