Cách đọc tệp văn bản vào danh sách Python
Trong hướng dẫn ngắn này, chúng ta sẽ tìm hiểu cách truy xuất nội dung của tệp dưới dạng danh sách các từ bằng Python Show
Xác định nội dung tệp mẫuHãy bắt đầu bằng cách tạo một tệp mới với một số nội dung mẫu mà bạn có thể sử dụng để làm theo hướng dẫn này
Điều này sẽ trả về số nguyên 58, là số ký tự trong văn bản chúng tôi đã viết Nhập danh sách các từ từ tệp vào danh sáchĐể tạo danh sách các từ trong tệp, chúng tôi sẽ sử dụng hai chức năng
Chúng tôi cũng sẽ sử dụng khối with, khối này đảm nhiệm việc xử lý tệp và giúp chúng tôi không phải đóng tệp một cách rõ ràng sau khi đọc nó
Nếu chúng tôi in word_lst, chúng tôi sẽ nhận được một phân chia từng từ của tệp của chúng tôi
['This', 'is', 'our', 'log', 'file', 'that', 'we', 'will', 'parse', 'using', 'Python', 'code.'] Đọc nhiều dòng tệp từng từChúng ta có thể sử dụng phương pháp đã nêu ở trên để chia các tệp nhiều dòng thành các từ. Nhưng nếu chúng ta muốn lấy một danh sách từng từ riêng biệt cho mỗi dòng/chuỗi trong tệp của mình thì sao? Các lập trình viên Python sử dụng nhiều mảng, danh sách và từ điển làm cấu trúc dữ liệu tuần tự hóa. Việc lưu trữ liên tục các cấu trúc dữ liệu này yêu cầu tệp hoặc cơ sở dữ liệu hoạt động bình thường
Để ghi dữ liệu vào một tệp và để đọc dữ liệu từ một tệp, ngôn ngữ lập trình Python cung cấp các phương thức tiêu chuẩn Sử dụng các Phương thức read() và write()Để xử lý các ký tự (chuỗi), các phương thức cơ bản Đầu tiên, Hãy nhớ rằng bạn sẽ cần xóa dấu ngắt dòng ở cuối chuỗi. Trong trường hợp này, nó giúp chúng ta rằng Python cũng cho phép liệt kê các thao tác trên chuỗi. Việc loại bỏ này được thực hiện đơn giản như một thao tác danh sách trên chính chuỗi, giữ mọi thứ trừ phần tử cuối cùng. Phần tử này chứa ký tự Sử dụng các Phương thức writelines() và readlines()Như đã đề cập ở đầu bài viết này, Python cũng chứa hai phương thức - Để đọc toàn bộ danh sách từ một tệp trên đĩa, chúng ta cần Đoạn mã trên tuân theo cách tiếp cận truyền thống hơn được vay mượn từ các ngôn ngữ lập trình khác. Hãy viết nó theo cách Pythonic hơn Thứ nhất, nội dung tệp được đọc qua So với danh sách trước mã này nhỏ gọn hơn nhiều, nhưng có thể khó đọc hơn đối với các lập trình viên Python mới bắt đầu Sử dụng Mô-đun JoblibCác phương pháp ban đầu được giải thích cho đến nay lưu trữ danh sách theo cách mà con người vẫn có thể đọc được - theo đúng nghĩa đen là một danh sách tuần tự trong một tệp. Điều này thật tuyệt vời để tạo các báo cáo đơn giản hoặc xuất tệp xuất để người dùng sử dụng thêm, chẳng hạn như tệp CSV. Tuy nhiên - nếu mục đích của bạn là chỉ tuần tự hóa một danh sách thành một tệp, có thể được tải sau này, thì không cần phải lưu trữ nó ở định dạng mà con người có thể đọc được Mô-đun
Sử dụng Mô-đun dưa chuaĐể thay thế cho Bước tiếp theo ta đọc danh sách từ file như sau. Đầu tiên, tệp đầu ra Hai ví dụ ở đây chứng minh việc sử dụng các chuỗi. Mặc dù, Sử dụng định dạng JSONĐịnh dạng dữ liệu nhị phân mà Hãy xem hướng dẫn thực hành, thực tế của chúng tôi để học Git, với các phương pháp hay nhất, tiêu chuẩn được ngành chấp nhận và bao gồm bảng gian lận. Dừng các lệnh Git trên Google và thực sự tìm hiểu nó Ví dụ sau minh họa cách ghi danh sách các loại biến hỗn hợp vào tệp đầu ra bằng mô-đun json. Sau khi mở tệp đầu ra để ghi, phương thức Đọc nội dung của tệp đầu ra trở lại bộ nhớ cũng đơn giản như ghi dữ liệu. Phương thức tương ứng với Phần kết luậnCác phương pháp khác nhau mà chúng tôi đã trình bày ở trên bao gồm từ ghi/đọc dữ liệu đơn giản cho đến kết xuất/tải dữ liệu qua luồng nhị phân bằng cách sử dụng dưa chua và JSON. Điều này đơn giản hóa việc lưu trữ một danh sách liên tục và đọc lại vào bộ nhớ Làm cách nào để chuyển đổi từng từ trong tệp văn bản thành danh sách trong Python?Một cách khác để chuyển đổi chuỗi thành danh sách là sử dụng phương thức split() Python . Phương thức split() tách một chuỗi thành một danh sách, trong đó mỗi mục danh sách là mỗi từ tạo nên chuỗi. Mỗi từ sẽ là một mục danh sách riêng lẻ.
Lệnh nào đọc một tệp vào danh sách Python?Ví dụ 01. đọc() . Phương pháp đầu tiên để đọc dữ liệu tệp vào danh sách là sử dụng hàm “read()” của python cùng với hàm “split()” trong mã. Mở tệp notepad dưới dạng tệp “txt” và thêm một số dữ liệu vào tệp đó. |