Hướng dẫn check encoding type python - kiểm tra loại mã hóa python

Nếu bạn không hài lòng với các công cụ tự động, bạn có thể thử tất cả các codec và xem codec nào đúng theo cách thủ công.

Show

Nội phân chính

  • Tệp là gì?
  • Kết thúc dòng
  • Mã hóa ký tự
  • Mở và đóng một tập tin trong Python
  • Loại tệp văn bản
  • Các loại tệp nhị phân được đệm
  • Các loại tệp thô
  • Đọc và viết các tệp đã mở
  • Lặp lại trên từng dòng trong tệp
  • Làm việc với byte
  • Một ví dụ đầy đủ: dos2unix.py
  • Các mẹo và thủ thuật
  • Nối vào một tập tin
  • Làm việc với hai tệp cùng một lúc
  • Tạo trình quản lý bối cảnh của riêng bạn
  • Don lồng phát minh lại con rắn
  • Bạn là một pháp sư tập tin Harry!

all_codecs = ['ascii', 'big5', 'big5hkscs', 'cp037', 'cp273', 'cp424', 'cp437', 
'cp500', 'cp720', 'cp737', 'cp775', 'cp850', 'cp852', 'cp855', 'cp856', 'cp857', 
'cp858', 'cp860', 'cp861', 'cp862', 'cp863', 'cp864', 'cp865', 'cp866', 'cp869', 
'cp874', 'cp875', 'cp932', 'cp949', 'cp950', 'cp1006', 'cp1026', 'cp1125', 
'cp1140', 'cp1250', 'cp1251', 'cp1252', 'cp1253', 'cp1254', 'cp1255', 'cp1256', 
'cp1257', 'cp1258', 'euc_jp', 'euc_jis_2004', 'euc_jisx0213', 'euc_kr', 
'gb2312', 'gbk', 'gb18030', 'hz', 'iso2022_jp', 'iso2022_jp_1', 'iso2022_jp_2', 
'iso2022_jp_2004', 'iso2022_jp_3', 'iso2022_jp_ext', 'iso2022_kr', 'latin_1', 
'iso8859_2', 'iso8859_3', 'iso8859_4', 'iso8859_5', 'iso8859_6', 'iso8859_7', 
'iso8859_8', 'iso8859_9', 'iso8859_10', 'iso8859_11', 'iso8859_13', 
'iso8859_14', 'iso8859_15', 'iso8859_16', 'johab', 'koi8_r', 'koi8_t', 'koi8_u', 
'kz1048', 'mac_cyrillic', 'mac_greek', 'mac_iceland', 'mac_latin2', 'mac_roman', 
'mac_turkish', 'ptcp154', 'shift_jis', 'shift_jis_2004', 'shift_jisx0213', 
'utf_32', 'utf_32_be', 'utf_32_le', 'utf_16', 'utf_16_be', 'utf_16_le', 'utf_7', 
'utf_8', 'utf_8_sig']

def find_codec(text):
    for i in all_codecs:
        for j in all_codecs:
            try:
                print(i, "to", j, text.encode(i).decode(j))
            except:
                pass

find_codec("The example string which includes ö, ü, or ÄŸ, ö")

Kịch bản này tạo ra ít nhất 9409 dòng đầu ra. Vì vậy, nếu đầu ra không thể phù hợp với màn hình đầu cuối, hãy cố gắng ghi đầu ra vào tệp văn bản.

Xem bây giờ hướng dẫn này có một khóa học video liên quan được tạo bởi nhóm Python thực sự. Xem cùng với hướng dẫn bằng văn bản để hiểu sâu hơn về sự hiểu biết của bạn: Đọc và ghi các tập tin bằng Python This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Reading and Writing Files in Python

Một trong những nhiệm vụ phổ biến nhất mà bạn có thể làm với Python là đọc và viết tệp. Cho dù nó viết vào một tệp văn bản đơn giản, đọc nhật ký máy chủ phức tạp hoặc thậm chí phân tích dữ liệu byte thô, tất cả các tình huống này đều yêu cầu đọc hoặc viết một tệp.

Trong hướng dẫn này, bạn sẽ học:

  • Điều gì tạo nên một tập tin và tại sao điều đó quan trọng trong Python
  • Những điều cơ bản của việc đọc và ghi các tập tin trong Python
  • Một số kịch bản cơ bản về đọc và ghi tệp

Hướng dẫn này chủ yếu dành cho người mới bắt đầu đến trung gian Pythonistas, nhưng có một số lời khuyên ở đây mà các lập trình viên tiên tiến hơn cũng có thể đánh giá cao.

Tệp là gì?

Trước khi chúng ta có thể đi vào cách làm việc với các tệp trong Python, điều quan trọng là phải hiểu chính xác một tệp là gì và cách các hệ điều hành hiện đại xử lý một số khía cạnh của chúng.

Tại cốt lõi của nó, một tệp là một tập hợp các byte tiếp giáp được sử dụng để lưu trữ dữ liệu. Dữ liệu này được tổ chức theo một định dạng cụ thể và có thể đơn giản như tệp văn bản hoặc phức tạp như một chương trình có thể thực thi. Cuối cùng, các tệp byte này sau đó được dịch thành nhị phân

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
6 và
/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
7 để xử lý dễ dàng hơn bởi máy tính.

Các tệp trên hầu hết các hệ thống tệp hiện đại bao gồm ba phần chính:

  1. Tiêu đề: Siêu dữ liệu về nội dung của tệp (tên tệp, kích thước, loại, v.v.) metadata about the contents of the file (file name, size, type, and so on)
  2. Dữ liệu: Nội dung của tệp được viết bởi người tạo hoặc trình chỉnh sửa contents of the file as written by the creator or editor
  3. Kết thúc tệp (EOF): ký tự đặc biệt cho biết phần cuối của tệp special character that indicates the end of the file

Hướng dẫn check encoding type python - kiểm tra loại mã hóa python

Những gì dữ liệu này thể hiện phụ thuộc vào đặc tả định dạng được sử dụng, thường được biểu thị bằng một phần mở rộng. Ví dụ: một tệp có phần mở rộng

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
8 rất có thể phù hợp với đặc tả định dạng trao đổi đồ họa. Có hàng trăm, nếu không phải hàng ngàn phần mở rộng tệp ngoài kia. Đối với hướng dẫn này, bạn sẽ chỉ xử lý các phần mở rộng tệp
/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
9 hoặc
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
0.

Đường dẫn tập tin

Khi bạn truy cập một tệp trên một hệ điều hành, một đường dẫn tệp được yêu cầu. Đường dẫn tệp là một chuỗi đại diện cho vị trí của một tệp. Nó chia thành ba phần chính:

  1. Đường dẫn thư mục: Vị trí thư mục tệp trên hệ thống tệp nơi các thư mục tiếp theo được phân tách bằng dấu gạch chéo phía trước
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    1 (UNIX) hoặc Backslash
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    2 (Windows)
    the file folder location on the file system where subsequent folders are separated by a forward slash
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    1 (Unix) or backslash
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    2 (Windows)
  2. Tên tệp: Tên thực của tệp the actual name of the file
  3. Tiện ích mở rộng: Phần cuối của đường dẫn tệp được ưu tiên với một khoảng thời gian (
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    3) được sử dụng để chỉ ra loại tệp
    the end of the file path pre-pended with a period (
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    3) used to indicate the file type

Ở đây, một ví dụ nhanh chóng. Hãy nói rằng bạn có một tệp nằm trong cấu trúc tệp như thế này:

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv

Hãy nói rằng bạn muốn truy cập vào tệp

Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
4 và vị trí hiện tại của bạn nằm trong cùng thư mục với
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
5. Để truy cập tệp, bạn cần đi qua thư mục
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
5 và sau đó là thư mục
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
7, cuối cùng đến tệp
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
4. Đường dẫn thư mục là
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
9. Tên tệp là
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
0. Phần mở rộng tệp là
/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
8. Vì vậy, đường dẫn đầy đủ là
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
2.

Bây giờ, hãy để nói rằng vị trí hiện tại hoặc thư mục làm việc hiện tại của bạn (CWD) nằm trong thư mục

Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
7 của cấu trúc thư mục ví dụ của chúng tôi. Thay vì đề cập đến
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
4 theo đường dẫn đầy đủ của
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
2, tệp có thể được tham chiếu đơn giản bằng tên tệp và tiện ích mở rộng
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
4.

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv

Nhưng còn

Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
7 thì sao? Làm thế nào bạn sẽ truy cập vào đó mà không cần sử dụng đường dẫn đầy đủ? Bạn có thể sử dụng DOT đôi ký tự đặc biệt (
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
8) để di chuyển một thư mục lên. Điều này có nghĩa là
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
9 sẽ tham chiếu tệp
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
7 từ thư mục của
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
7:

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv

DOT đôi (

Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
8) có thể được xích lại với nhau để vượt qua nhiều thư mục trên thư mục hiện tại. Ví dụ: để truy cập
file = open('dog_breeds.txt')
3 từ thư mục
Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n
7, bạn sẽ sử dụng
file = open('dog_breeds.txt')
5.

Kết thúc dòng

Một vấn đề thường gặp phải khi làm việc với dữ liệu tệp là biểu diễn của một dòng mới hoặc kết thúc dòng. Kết thúc dòng có nguồn gốc từ trở lại trong kỷ nguyên mã Morse, khi một ký hiệu ủng hộ cụ thể được sử dụng để truyền đạt sự kết thúc của việc truyền hoặc kết thúc của một dòng.

Sau đó, điều này đã được tiêu chuẩn hóa cho các nhà giao dịch từ xa bởi cả Tổ chức Tiêu chuẩn hóa Quốc tế (ISO) và Hiệp hội Tiêu chuẩn Hoa Kỳ (ASA). ASA tiêu chuẩn nói rằng các kết thúc dòng nên sử dụng trình tự trả lại vận chuyển (

file = open('dog_breeds.txt')
6 hoặc
file = open('dog_breeds.txt')
7) và các ký tự nguồn cấp dữ liệu dòng (
file = open('dog_breeds.txt')
8 hoặc
file = open('dog_breeds.txt')
9) (
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
0 hoặc
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
1). Tuy nhiên, tiêu chuẩn ISO cho phép các ký tự
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
0 hoặc chỉ là ký tự
file = open('dog_breeds.txt')
8.

Windows sử dụng các ký tự

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
0 để chỉ ra một dòng mới, trong khi các phiên bản UNIX và MAC mới hơn chỉ sử dụng ký tự
file = open('dog_breeds.txt')
8. Điều này có thể gây ra một số biến chứng khi bạn xử lý các tệp trên một hệ điều hành khác với nguồn tệp. Ở đây, một ví dụ nhanh chóng. Hãy nói rằng chúng tôi kiểm tra tệp
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
7 được tạo trên hệ thống Windows:

Pug\r\n
Jack Russell Terrier\r\n
English Springer Spaniel\r\n
German Shepherd\r\n
Staffordshire Bull Terrier\r\n
Cavalier King Charles Spaniel\r\n
Golden Retriever\r\n
West Highland White Terrier\r\n
Boxer\r\n
Border Terrier\r\n

Đầu ra tương tự này sẽ được giải thích trên một thiết bị UNIX khác nhau:

Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n

Điều này có thể làm cho việc lặp lại trên mỗi dòng có vấn đề và bạn có thể cần phải tính đến các tình huống như thế này.

Mã hóa ký tự

Một vấn đề phổ biến khác mà bạn có thể gặp phải là mã hóa dữ liệu byte. Một mã hóa là một bản dịch từ dữ liệu byte sang các ký tự có thể đọc được của con người. Điều này thường được thực hiện bằng cách gán một giá trị số để thể hiện một ký tự. Hai mã hóa phổ biến nhất là các định dạng ASCII và Unicode. ASCII chỉ có thể lưu trữ 128 ký tự, trong khi Unicode có thể chứa tới 1.114.112 ký tự.

ASCII thực sự là một tập hợp con của Unicode (UTF-8), có nghĩa là ASCII và Unicode có chung số lượng với các giá trị ký tự. Điều quan trọng cần lưu ý là việc phân tích một tệp có mã hóa ký tự không chính xác có thể dẫn đến lỗi hoặc trình bày sai về ký tự. Ví dụ: nếu một tệp được tạo bằng mã hóa UTF-8 và bạn cố gắng phân tích nó bằng mã hóa ASCII, nếu có một ký tự nằm ngoài 128 giá trị đó, thì sẽ bị lỗi.

Mở và đóng một tập tin trong Python

Khi bạn muốn làm việc với một tệp, điều đầu tiên cần làm là mở nó. Điều này được thực hiện bằng cách gọi chức năng tích hợp

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7.
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 có một đối số bắt buộc duy nhất là đường dẫn đến tệp.
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 có một lần trả về duy nhất, đối tượng tệp:

file = open('dog_breeds.txt')

Sau khi bạn mở một tập tin, điều tiếp theo để học là làm thế nào để đóng nó.

Điều quan trọng cần nhớ là nó có trách nhiệm đóng tệp. Trong hầu hết các trường hợp, khi chấm dứt ứng dụng hoặc tập lệnh, cuối cùng một tệp sẽ được đóng. Tuy nhiên, không có gì đảm bảo khi chính xác điều đó sẽ xảy ra. Điều này có thể dẫn đến hành vi không mong muốn bao gồm rò rỉ tài nguyên. Nó cũng là một thực tiễn tốt nhất trong Python (Pythonic) để đảm bảo rằng mã của bạn hoạt động theo cách được xác định rõ và giảm bất kỳ hành vi không mong muốn nào.

Khi bạn điều khiển một tệp, có hai cách bạn có thể sử dụng để đảm bảo rằng một tệp được đóng đúng, ngay cả khi gặp lỗi. Cách đầu tiên để đóng tệp là sử dụng khối

with open('dog_breeds.txt') as reader:
    # Further file processing goes here
0:

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()

Nếu bạn không quen thuộc với khối

with open('dog_breeds.txt') as reader:
    # Further file processing goes here
0 là gì, hãy xem các ngoại lệ của Python: Giới thiệu.

Cách thứ hai để đóng tệp là sử dụng câu lệnh

with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2:

with open('dog_breeds.txt') as reader:
    # Further file processing goes here

Câu lệnh

with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2 tự động chăm sóc việc đóng tệp một khi nó rời khỏi khối
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2, ngay cả trong trường hợp lỗi. Tôi thực sự khuyên bạn nên sử dụng câu lệnh
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2 càng nhiều càng tốt, vì nó cho phép mã sạch hơn và giúp xử lý mọi lỗi bất ngờ dễ dàng hơn cho bạn.

Nhiều khả năng, bạn cũng sẽ muốn sử dụng đối số vị trí thứ hai,

with open('dog_breeds.txt') as reader:
    # Further file processing goes here
6. Đối số này là một chuỗi chứa nhiều ký tự để thể hiện cách bạn muốn mở tệp. Mặc định và phổ biến nhất là
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
7, đại diện cho việc mở tệp ở chế độ chỉ đọc dưới dạng tệp văn bản:

with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here

Các tùy chọn khác cho các chế độ được ghi lại đầy đủ trực tuyến, nhưng các tùy chọn được sử dụng phổ biến nhất là:

Tính cáchNghĩa
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
7
Mở để đọc (mặc định)
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
9
Mở để viết, cắt ngắn (ghi đè) tệp trước
with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
0 hoặc
with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
1
Mở ở chế độ nhị phân (đọc/ghi bằng dữ liệu byte)

Hãy để Lừa quay lại và nói một chút về các đối tượng tệp. Một đối tượng tệp là:

Một đối tượng hiển thị API định hướng tệp (với các phương thức như

with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
2 hoặc
with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
3) với tài nguyên cơ bản. (Nguồn)

Có ba loại đối tượng tệp khác nhau:

  • Tệp văn bản
  • Các tập tin nhị phân đệm
  • Tập tin nhị phân thô

Mỗi loại tệp này được xác định trong mô -đun

with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
4. Ở đây, một bản tóm tắt nhanh chóng về cách mọi thứ xếp hàng.

Loại tệp văn bản

Tệp văn bản là tệp phổ biến nhất mà bạn sẽ gặp. Dưới đây là một số ví dụ về cách các tệp này được mở:

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
0

Với các loại tệp này,

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 sẽ trả về đối tượng tệp
with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
6:

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
1

Đây là đối tượng tệp mặc định được trả về bởi

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7.

Các loại tệp nhị phân được đệm

Một loại tệp nhị phân được đệm được sử dụng để đọc và viết các tệp nhị phân. Dưới đây là một số ví dụ về cách các tệp này được mở:

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
2

Với các loại tệp này,

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 sẽ trả về đối tượng tệp
with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
9 hoặc
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
00:

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
3

Đây là đối tượng tệp mặc định được trả về bởi reader = open('dog_breeds.txt') try: # Further file processing goes here finally: reader.close() 7.

Các loại tệp nhị phân được đệm

Một loại tệp nhị phân được đệm được sử dụng để đọc và viết các tệp nhị phân. Dưới đây là một số ví dụ về cách các tệp này được mở:

Với các loại tệp này,

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 sẽ trả về đối tượng tệp
with open('dog_breeds.txt', 'r') as reader:
    # Further file processing goes here
9 hoặc
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
00:

Các loại tệp thô

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
4

Một loại tệp thô là:

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
5

Nói chung, được sử dụng như một khối xây dựng cấp thấp cho các luồng nhị phân và văn bản. (Nguồn)

Do đó, nó thường không được sử dụng.

Ở đây, một ví dụ về cách các tệp này được mở:Với các loại tệp này,
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 sẽ trả về đối tượng tệp
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
02:
Đọc và viết các tệp đã mởKhi bạn đã mở một tệp, bạn sẽ muốn đọc hoặc ghi vào tệp. Trước hết, hãy để che phủ đọc một tập tin. Có nhiều phương thức có thể được gọi trên đối tượng tệp để giúp bạn:
Phương phápNhững gì nó làm
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
03
Điều này đọc từ tệp dựa trên số byte
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
04. Nếu không có đối số nào được thông qua hoặc
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
05 hoặc
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
06 được thông qua, thì toàn bộ tệp được đọc.

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
07

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
6

Điều này đọc nhiều nhất là số lượng ký tự từ dòng. Điều này tiếp tục đến cuối dòng và sau đó quấn lại xung quanh. Nếu không có đối số nào được thông qua hoặc

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
05 hoặc
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
06 được thông qua, thì toàn bộ dòng (hoặc phần còn lại của dòng) sẽ được đọc.

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
7

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
11

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
8

Điều này đọc các dòng còn lại từ đối tượng tệp và trả về chúng dưới dạng danh sách.

>>>

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
9

Sử dụng cùng một tệp Pug\r \n Jack Russell Terrier\r \n English Springer Spaniel\r \n German Shepherd\r \n Staffordshire Bull Terrier\r \n Cavalier King Charles Spaniel\r \n Golden Retriever\r \n West Highland White Terrier\r \n Boxer\r \n Border Terrier\r \n 7 mà bạn đã sử dụng ở trên, hãy để xem qua một số ví dụ về cách sử dụng các phương pháp này. Dưới đây, một ví dụ về cách mở và đọc toàn bộ tệp bằng / │ ├── path/ | │ │ ├── to/ │ │ └── cats.gif │ │ │ └── dog_breeds.txt | └── animals.csv 13:

Dưới đây, một ví dụ về cách đọc 5 byte của một dòng mỗi lần bằng phương pháp Python

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
14:

>>>

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
0

Dưới đây, một ví dụ về cách đọc toàn bộ tệp dưới dạng danh sách bằng phương thức Python

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
11:

>>>

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
1

Ví dụ trên cũng có thể được thực hiện bằng cách sử dụng

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
16 để tạo danh sách ra khỏi đối tượng tệp:

>>>

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
2

Lặp lại trên từng dòng trong tệp

Một điều phổ biến cần làm trong khi đọc một tệp là lặp lại trên mỗi dòng. Dưới đây, một ví dụ về cách sử dụng phương pháp Python

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
14 để thực hiện phép lặp đó:

Ở đây, một ví dụ về cách các tệp này được mở:Với các loại tệp này,
reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 sẽ trả về đối tượng tệp
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
02:
Đọc và viết các tệp đã mởKhi bạn đã mở một tệp, bạn sẽ muốn đọc hoặc ghi vào tệp. Trước hết, hãy để che phủ đọc một tập tin. Có nhiều phương thức có thể được gọi trên đối tượng tệp để giúp bạn:
Phương phápNhững gì nó làm

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
03

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
3

Điều này đọc từ tệp dựa trên số byte / │ ├── path/ | │ │ ├── to/ │ │ └── cats.gif │ │ │ └── dog_breeds.txt | └── animals.csv 04. Nếu không có đối số nào được thông qua hoặc / │ ├── path/ | │ │ ├── to/ │ │ └── cats.gif │ │ │ └── dog_breeds.txt | └── animals.csv 05 hoặc / │ ├── path/ | │ │ ├── to/ │ │ └── cats.gif │ │ │ └── dog_breeds.txt | └── animals.csv 06 được thông qua, thì toàn bộ tệp được đọc.

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
07

>>>

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
4

Điều này đọc nhiều nhất là số lượng ký tự từ dòng. Điều này tiếp tục đến cuối dòng và sau đó quấn lại xung quanh. Nếu không có đối số nào được thông qua hoặc

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
05 hoặc
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
06 được thông qua, thì toàn bộ dòng (hoặc phần còn lại của dòng) sẽ được đọc.

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
11

Điều này đọc các dòng còn lại từ đối tượng tệp và trả về chúng dưới dạng danh sách.

Sử dụng cùng một tệp
Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
7 mà bạn đã sử dụng ở trên, hãy để xem qua một số ví dụ về cách sử dụng các phương pháp này. Dưới đây, một ví dụ về cách mở và đọc toàn bộ tệp bằng
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
13:
Dưới đây, một ví dụ về cách đọc 5 byte của một dòng mỗi lần bằng phương pháp Python
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
14:
Dưới đây, một ví dụ về cách đọc toàn bộ tệp dưới dạng danh sách bằng phương thức Python
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
11:
Ví dụ trên cũng có thể được thực hiện bằng cách sử dụng
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
16 để tạo danh sách ra khỏi đối tượng tệp:
Lặp lại trên từng dòng trong tệpMột điều phổ biến cần làm trong khi đọc một tệp là lặp lại trên mỗi dòng. Dưới đây, một ví dụ về cách sử dụng phương pháp Python
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
14 để thực hiện phép lặp đó:
Một cách khác, bạn có thể lặp lại trên mỗi dòng trong tệp là sử dụng phương thức Python
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
11 của đối tượng tệp. Hãy nhớ rằng,
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
11 Trả về một danh sách trong đó mỗi phần tử trong danh sách đại diện cho một dòng trong tệp:
Tuy nhiên, các ví dụ trên có thể được đơn giản hóa hơn nữa bằng cách lặp trên chính đối tượng tệp:
Cách tiếp cận cuối cùng này là Pythonic hơn và có thể nhanh hơn và hiệu quả hơn về bộ nhớ. Do đó, bạn đề nghị bạn sử dụng điều này thay thế.Bây giờ, hãy để Lặn đi vào các tập tin viết. Cũng như đọc tệp, các đối tượng tệp có nhiều phương thức hữu ích để ghi vào tệp:
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
20
Điều này ghi chuỗi vào tệp.

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
21

>>>

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
5

Điều này viết chuỗi vào tệp. Không có kết thúc dòng được nối vào từng mục trình tự. Nó tùy thuộc vào bạn để thêm (các) kết thúc dòng thích hợp.

Ở đây, một ví dụ nhanh về việc sử dụng

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
22 và
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
23:

Làm việc với byte

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
6

Các mẹo và thủ thuật

Bây giờ bạn đã thành thạo những điều cơ bản về đọc và viết các tập tin, đây là một số mẹo và thủ thuật để giúp bạn phát triển kỹ năng của mình.

/ │ ├── path/ | │ │ ├── to/ │ │ └── cats.gif │ │ │ └── dog_breeds.txt | └── animals.csv 53

Thuộc tính

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
53 là một thuộc tính đặc biệt của các mô -đun, tương tự như
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
55. Nó là:

Tên đường dẫn của tệp mà mô -đun được tải, nếu nó được tải từ một tệp. (Nguồn

Ở đây, một ví dụ thế giới thực. Trong một trong những công việc trước đây của tôi, tôi đã thực hiện nhiều bài kiểm tra cho một thiết bị phần cứng. Mỗi bài kiểm tra được viết bằng tập lệnh Python với tên tệp tập lệnh thử nghiệm được sử dụng làm tiêu đề. Các tập lệnh này sau đó sẽ được thực thi và có thể in trạng thái của chúng bằng thuộc tính đặc biệt

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
53. Ở đây, một cấu trúc thư mục ví dụ:

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
7

Chạy

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
57 Sản xuất như sau:

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
8

Tôi đã có thể chạy và nhận trạng thái của tất cả các bài kiểm tra của mình một cách linh hoạt thông qua việc sử dụng thuộc tính đặc biệt của

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
53.

Nối vào một tập tin

Đôi khi, bạn có thể muốn nối vào một tệp hoặc bắt đầu viết ở cuối tệp đã có. Điều này dễ dàng được thực hiện bằng cách sử dụng ký tự

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
59 cho đối số
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
6:

/
│
├── path/
|   │
|   ├── to/  ← Your current working directory (cwd) is here
|   │   └── cats.gif  ← Accessing this file
|   │
|   └── dog_breeds.txt
|
└── animals.csv
9

Khi bạn kiểm tra lại

Pug\r
\n
Jack Russell Terrier\r
\n
English Springer Spaniel\r
\n
German Shepherd\r
\n
Staffordshire Bull Terrier\r
\n
Cavalier King Charles Spaniel\r
\n
Golden Retriever\r
\n
West Highland White Terrier\r
\n
Boxer\r
\n
Border Terrier\r
\n
7, bạn sẽ thấy rằng phần đầu của tệp không thay đổi và
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
62 hiện được thêm vào cuối tệp:

>>>

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
0

Làm việc với hai tệp cùng một lúc

Có những lúc bạn có thể muốn đọc một tệp và ghi vào một tệp khác cùng một lúc. Nếu bạn sử dụng ví dụ được hiển thị khi bạn đang học cách ghi vào một tệp, thì nó thực sự có thể được kết hợp thành các vấn đề sau:

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
1

Tạo trình quản lý bối cảnh của riêng bạn

Có thể đến lúc bạn sẽ cần kiểm soát tốt hơn đối tượng tệp bằng cách đặt nó bên trong một lớp tùy chỉnh. Khi bạn làm điều này, sử dụng câu lệnh

with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2 không còn có thể được sử dụng trừ khi bạn thêm một vài phương pháp ma thuật:
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
64 và
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
65. Bằng cách thêm những thứ này, bạn sẽ tạo ra cái mà người ta gọi là người quản lý ngữ cảnh.

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
66 được gọi khi gọi câu lệnh
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2.
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
68 được gọi khi thoát khỏi khối tuyên bố
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2.

Dưới đây, một mẫu mà bạn có thể sử dụng để tạo lớp tùy chỉnh của mình:

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
2

Bây giờ bạn đã có lớp tùy chỉnh của mình hiện là người quản lý ngữ cảnh, bạn có thể sử dụng nó tương tự như

reader = open('dog_breeds.txt')
try:
    # Further file processing goes here
finally:
    reader.close()
7 tích hợp:

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
3

Đây là một ví dụ tốt. Bạn có nhớ hình ảnh Jack Russell dễ thương mà chúng tôi đã có không? Có lẽ bạn muốn mở các tệp

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
29 khác nhưng không muốn phân tích tệp tiêu đề mỗi lần. Ở đây, một ví dụ về cách làm điều này. Ví dụ này cũng sử dụng trình lặp tùy chỉnh. Nếu bạn không quen thuộc với họ, hãy xem Python Iterators:

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
4

Bây giờ bạn có thể mở các tệp

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
29 và phân tích đúng chúng bằng cách sử dụng Trình quản lý bối cảnh tùy chỉnh của bạn:

>>>

/
│
├── path/  ← Referencing this parent folder
|   │
|   ├── to/  ← Current working directory (cwd)
|   │   └── cats.gif
|   │
|   └── dog_breeds.txt  ← Accessing this file
|
└── animals.csv
5

Làm việc với hai tệp cùng một lúc

Có những lúc bạn có thể muốn đọc một tệp và ghi vào một tệp khác cùng một lúc. Nếu bạn sử dụng ví dụ được hiển thị khi bạn đang học cách ghi vào một tệp, thì nó thực sự có thể được kết hợp thành các vấn đề sau:

  • Tạo trình quản lý bối cảnh của riêng bạn
  • Có thể đến lúc bạn sẽ cần kiểm soát tốt hơn đối tượng tệp bằng cách đặt nó bên trong một lớp tùy chỉnh. Khi bạn làm điều này, sử dụng câu lệnh
    with open('dog_breeds.txt') as reader:
        # Further file processing goes here
    
    2 không còn có thể được sử dụng trừ khi bạn thêm một vài phương pháp ma thuật:
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    64 và
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    65. Bằng cách thêm những thứ này, bạn sẽ tạo ra cái mà người ta gọi là người quản lý ngữ cảnh.

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
66 được gọi khi gọi câu lệnh
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2.
/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
68 được gọi khi thoát khỏi khối tuyên bố
with open('dog_breeds.txt') as reader:
    # Further file processing goes here
2.

  • Dưới đây, một mẫu mà bạn có thể sử dụng để tạo lớp tùy chỉnh của mình:: read and write WAV files (audio)
  • Bây giờ bạn đã có lớp tùy chỉnh của mình hiện là người quản lý ngữ cảnh, bạn có thể sử dụng nó tương tự như
    reader = open('dog_breeds.txt')
    try:
        # Further file processing goes here
    finally:
        reader.close()
    
    7 tích hợp:
    : read and write AIFF and AIFC files (audio)
  • Đây là một ví dụ tốt. Bạn có nhớ hình ảnh Jack Russell dễ thương mà chúng tôi đã có không? Có lẽ bạn muốn mở các tệp
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    29 khác nhưng không muốn phân tích tệp tiêu đề mỗi lần. Ở đây, một ví dụ về cách làm điều này. Ví dụ này cũng sử dụng trình lặp tùy chỉnh. Nếu bạn không quen thuộc với họ, hãy xem Python Iterators:
    : read and write Sun AU files
  • Bây giờ bạn có thể mở các tệp
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    29 và phân tích đúng chúng bằng cách sử dụng Trình quản lý bối cảnh tùy chỉnh của bạn:
    : read and write tar archive files
  • Don lồng phát minh lại con rắn: work with ZIP archives
  • Có những tình huống phổ biến mà bạn có thể gặp phải khi làm việc với các tệp. Hầu hết các trường hợp này có thể được xử lý bằng các mô -đun khác. Hai loại tệp phổ biến bạn có thể cần làm việc là
    Pug\r\n
    Jack Russell Terrier\r\n
    English Springer Spaniel\r\n
    German Shepherd\r\n
    Staffordshire Bull Terrier\r\n
    Cavalier King Charles Spaniel\r\n
    Golden Retriever\r\n
    West Highland White Terrier\r\n
    Boxer\r\n
    Border Terrier\r\n
    
    0 và
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    74. Real Python đã kết hợp một số bài viết tuyệt vời về cách xử lý những điều này:
    : easily create and parse configuration files
  • Đọc và viết các tệp CSV bằng Python: create or read XML based files
  • Làm việc với dữ liệu JSON trong Python: read and write Microsoft Installer files
  • Ngoài ra, có các thư viện tích hợp ngoài kia mà bạn có thể sử dụng để giúp bạn:: generate and parse Mac OS X
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    84 files

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
75: Đọc và viết các tệp WAV (âm thanh)

  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    76: Đọc và viết tệp AIFF và AIFC (âm thanh)
    : PDF toolkit
  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    77: Đọc và viết các tệp Sun AU
    : read and write Excel files
  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    78: Đọc và ghi các tệp lưu trữ tar
    : image reading and manipulation

/ │ ├── path/ | │ │ ├── to/ │ │ └── cats.gif │ │ │ └── dog_breeds.txt | └── animals.csv 79: Làm việc với kho lưu trữ zip

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
80: Dễ dàng tạo và phân tích các tệp cấu hình

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
81: Tạo hoặc đọc các tệp dựa trên XML

  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    82: Đọc và ghi các tệp trình cài đặt Microsoft
  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    83: Tạo và phân tích các tệp Mac OS X
    /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    84
  • Có rất nhiều điều ngoài kia. Ngoài ra, thậm chí còn có nhiều công cụ bên thứ ba có sẵn trên PYPI. Một số người phổ biến là như sau:
  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    85: Bộ công cụ PDF
  • /
    │
    ├── path/
    |   │
    │   ├── to/
    │   │   └── cats.gif
    │   │
    │   └── dog_breeds.txt
    |
    └── animals.csv
    
    86: Đọc và ghi các tệp Excel

/
│
├── path/
|   │
│   ├── to/
│   │   └── cats.gif
│   │
│   └── dog_breeds.txt
|
└── animals.csv
87: Đọc và thao tác hình ảnh

Bạn là một pháp sư tập tin Harry! This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Reading and Writing Files in Python