Hướng dẫn python parse text file to xml - python phân tích cú pháp tệp văn bản thành xml

Question

Dưới đây là một phương pháp tốt hơn để chia các dòng.

Nội dung chính Show

Hướng dẫn¶
Cây XML và các yếu tố
Phân tích cú pháp xml¶
Kéo API cho phân tích cú pháp không chặn
Tìm các yếu tố thú vị
Sửa đổi tệp XML
Chúng ta có thể loại bỏ các phần tử bằng >>> root[0][1].text '2008' 7. Hãy nói rằng chúng tôi muốn loại bỏ tất cả các quốc gia với thứ hạng cao hơn 50:
Xây dựng tài liệu XML
Một cách tốt hơn để tìm kiếm ví dụ XML theo tên là tạo một từ điển với các tiền tố của riêng bạn và sử dụng chúng trong các chức năng tìm kiếm:
Hỗ trợ Xpath¶
Ở đây, một ví dụ chứng minh một số khả năng XPath của mô -đun. Chúng tôi sẽ sử dụng tài liệu XML >>> parser = ET.XMLPullParser(['start', 'end']) >>> parser.feed('sometext') >>> list(parser.read_events()) [('start', )] >>> parser.feed(' more text') >>> for event, elem in parser.read_events(): ... print(event) ... print(elem.tag, 'text=', elem.text) ... end 4 từ phần phân tích cú pháp XML:
Tài liệu tham khảo¶
Chức năng¶
Hỗ trợ Xinclude
Thí dụ¶
Tài liệu tham khảo¶
Chức năng¶
Đối tượng phần tử
Đối tượng ElementTree
Đối tượng Qname
Đối tượng TreeBuilder
pi (mục tiêu, văn bản) ¶
Được gọi sau khi gọi lại 1 2008 141100 4 2011 59900 68 2011 13600 51 của một phần tử đã khai báo ánh xạ tiền tố không gian tên, với tên của tiền tố đã đi ra khỏi phạm vi.
Ngoại lệ ha
Làm cách nào để chuyển đổi tệp TXT thành XML?
Làm thế nào để bạn đọc một tệp văn bản trong XML trong Python?
Làm thế nào để bạn phân tích XML trong Python?
Làm thế nào để bạn thêm thẻ XML trong Python?

Lưu ý rằng biến

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

4 về mặt kỹ thuật sẽ là tệp

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

5 của bạn và tôi đã cố tình sửa đổi nó để chúng tôi có bối cảnh đầu ra lớn hơn.

from collections import OrderedDict
from pprint import pprint

# Text would be our loaded .txt file.
text = """Serial Number:  test    Operator ID:  test1  Time:  00:03:47 Test Step 1      TP1:  17.25    TP2:  2.46
Serial Number:      Operator ID:  test2  Time:  00:03:48 Test Step 2      TP1:  17.24    TP2:  2.47"""

# Headers of the intended break-points in the text files.
headers = ["Serial Number:", "Operator ID:", "Time:", "TP1:", "TP2:"]

information = []

# Split our text by lines.
for line in text.split("\n"):

    # Split our text up so we only have the information per header.
    default_header = headers[0]
    for header in headers[1:]:
        line = line.replace(header, default_header)
    info = [i.strip() for i in line.split(default_header)][1:]

    # Compile our header+information together into OrderedDict's.
    compiled_information = OrderedDict()
    for header, info in zip(headers, info):
        compiled_information[header] = info

    # Append to our overall information list.
    information.append(compiled_information)

# Pretty print the information (not needed, only for better display of data.)
pprint(information)

Outputs:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

Phương pháp này nên khái quát hơn so với những gì bạn hiện đang viết và ý tưởng về mã là thứ tôi đã lưu từ một dự án khác. Tôi khuyên bạn nên trải qua mã và hiểu logic của nó.

Từ đây, bạn sẽ có thể lặp qua danh sách

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

6 và tạo tệp

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

7 tùy chỉnh của bạn. Tôi cũng khuyên bạn nên kiểm tra

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

8, vì nó có thể giúp cuộc sống của bạn dễ dàng hơn nhiều ở bước cuối cùng.

Liên quan đến mã của bạn, hãy nhớ: Phá vỡ các nhiệm vụ cơ bản dễ dàng hơn là cố gắng kết hợp tất cả chúng thành một. Bằng cách cố gắng tạo tệp

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

9 trong khi bạn phân chia tệp

root = ET.fromstring(country_data_as_string)

0, bạn đã tạo một con quái vật khó giải quyết khi nó quay trở lại với các lỗi. Thay vào đó, hãy thực hiện từng bước một - tạo "điểm kiểm tra" rằng bạn là công việc nhất định 100% và sau đó chuyển sang nhiệm vụ tiếp theo.

Mã nguồn: lib/xml/etree/ElementTree.py Lib/xml/etree/ElementTree.py

Mô -đun

root = ET.fromstring(country_data_as_string)

1 thực hiện API đơn giản và hiệu quả để phân tích dữ liệu XML và tạo dữ liệu XML.

Thay đổi trong phiên bản 3.3: Mô -đun này sẽ sử dụng triển khai nhanh bất cứ khi nào có sẵn.This module will use a fast implementation whenever available.

Không dùng nữa kể từ phiên bản 3.3: Mô -đun

root = ET.fromstring(country_data_as_string)

2 được không dùng nữa.The

root = ET.fromstring(country_data_as_string)

2 module is deprecated.

Hướng dẫn¶

Đây là một hướng dẫn ngắn để sử dụng

root = ET.fromstring(country_data_as_string)

1 (ngắn gọn). Mục tiêu là để chứng minh một số khối xây dựng và các khái niệm cơ bản của mô -đun.

Cây XML và các yếu tố

XML là một định dạng dữ liệu phân cấp vốn có và cách tự nhiên nhất để thể hiện nó là với một cây.

root = ET.fromstring(country_data_as_string)

4 có hai lớp cho mục đích này -

root = ET.fromstring(country_data_as_string)

6 đại diện cho toàn bộ tài liệu XML dưới dạng cây và

root = ET.fromstring(country_data_as_string)

7 đại diện cho một nút duy nhất trong cây này. Các tương tác với toàn bộ tài liệu (đọc và ghi vào/từ các tệp) thường được thực hiện ở cấp độ

root = ET.fromstring(country_data_as_string)

6. Các tương tác với một phần tử XML duy nhất và các phần tử phụ của nó được thực hiện ở cấp độ

root = ET.fromstring(country_data_as_string)

7.

Phân tích cú pháp xml¶

Chúng tôi sẽ sử dụng tài liệu XML sau làm dữ liệu mẫu cho phần này:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

Chúng tôi có thể nhập dữ liệu này bằng cách đọc từ một tệp:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

Hoặc trực tiếp từ một chuỗi:

root = ET.fromstring(country_data_as_string)

>>> root.tag
'data'
>>> root.attrib
{}

0 phân tích cú pháp XML từ một chuỗi trực tiếp vào

root = ET.fromstring(country_data_as_string)

7, là phần tử gốc của cây được phân tích cú pháp. Các chức năng phân tích cú pháp khác có thể tạo ra

root = ET.fromstring(country_data_as_string)

6. Kiểm tra tài liệu để chắc chắn.

Là một

root = ET.fromstring(country_data_as_string)

7,

>>> root.tag
'data'
>>> root.attrib
{}

4 có thẻ và từ điển thuộc tính:

>>> root.tag
'data'
>>> root.attrib
{}

Nó cũng có các nút trẻ em mà chúng ta có thể lặp lại:

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

Trẻ em được lồng và chúng ta có thể truy cập các nút trẻ cụ thể bằng chỉ mục:

>>> root[0][1].text
'2008'

Ghi chú

Không phải tất cả các yếu tố của đầu vào XML sẽ kết thúc dưới dạng các phần tử của cây phân tích cú pháp. Hiện tại, mô -đun này bỏ qua mọi nhận xét XML, hướng dẫn xử lý và khai báo loại tài liệu trong đầu vào. Tuy nhiên, các cây được xây dựng bằng API mô -đun này thay vì phân tích cú pháp từ văn bản XML có thể có nhận xét và hướng dẫn xử lý trong đó; Chúng sẽ được bao gồm khi tạo ra đầu ra XML. Một khai báo loại tài liệu có thể được truy cập bằng cách chuyển một thể hiện tùy chỉnh ____55 cho hàm tạo

>>> root.tag
'data'
>>> root.attrib
{}

6.

Kéo API cho phân tích cú pháp không chặn

Hầu hết các chức năng phân tích cú pháp được cung cấp bởi mô -đun này yêu cầu toàn bộ tài liệu được đọc cùng một lúc trước khi trả lại bất kỳ kết quả nào. Có thể sử dụng

>>> root.tag
'data'
>>> root.attrib
{}

6 và dữ liệu dữ liệu vào đó, nhưng đó là API đẩy gọi các phương thức trên mục tiêu gọi lại, mức độ quá thấp và bất tiện cho hầu hết các nhu cầu. Đôi khi những gì người dùng thực sự muốn là có thể phân tích XML tăng dần, mà không chặn các hoạt động, trong khi tận hưởng sự thuận tiện của các đối tượng

root = ET.fromstring(country_data_as_string)

7 được xây dựng đầy đủ.

Công cụ mạnh mẽ nhất để làm điều này là

>>> root.tag
'data'
>>> root.attrib
{}

9. Nó không yêu cầu đọc chặn để có được dữ liệu XML và thay vào đó được cung cấp với dữ liệu tăng dần với các cuộc gọi

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

0. Để có được các phần tử XML được phân tích cú pháp, hãy gọi

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

1. Đây là một ví dụ:

________số 8

Trường hợp sử dụng rõ ràng là các ứng dụng hoạt động theo kiểu không chặn trong đó dữ liệu XML được nhận từ ổ cắm hoặc đọc tăng dần từ một số thiết bị lưu trữ. Trong những trường hợp như vậy, chặn đọc là không thể chấp nhận được.

Bởi vì nó rất linh hoạt,

>>> root.tag
'data'
>>> root.attrib
{}

9 có thể bất tiện để sử dụng cho các trường hợp sử dụng đơn giản hơn. Nếu bạn không quan tâm đến việc chặn ứng dụng của mình khi đọc dữ liệu XML nhưng vẫn muốn có khả năng phân tích cú pháp gia tăng, hãy xem

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

3. Nó có thể hữu ích khi bạn đọc một tài liệu XML lớn và không muốn giữ nó hoàn toàn trong bộ nhớ.

Tìm các yếu tố thú vị

root = ET.fromstring(country_data_as_string)

7 có một số phương pháp hữu ích giúp lặp lại đệ quy trên tất cả các cây con bên dưới nó (con cái, con cái của họ, v.v.). Ví dụ:

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

5:

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

6 chỉ tìm thấy các yếu tố có thẻ là trẻ em trực tiếp của yếu tố hiện tại.

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

7 tìm thấy đứa con đầu lòng có một thẻ cụ thể và

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

8 truy cập vào nội dung văn bản phần tử.

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

9 Truy cập các thuộc tính của phần tử:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

0

Đặc điểm kỹ thuật tinh vi hơn về các yếu tố cần tìm là có thể bằng cách sử dụng XPath.XPath.

Sửa đổi tệp XML

root = ET.fromstring(country_data_as_string)

6 cung cấp một cách đơn giản để xây dựng các tài liệu XML và viết chúng vào các tệp. Phương pháp

>>> root[0][1].text
'2008'

1 phục vụ mục đích này.

Sau khi được tạo, một đối tượng

root = ET.fromstring(country_data_as_string)

7 có thể được thao tác bằng cách thay đổi trực tiếp các trường của nó (chẳng hạn như

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

8), thêm và sửa đổi các thuộc tính (phương thức

>>> root[0][1].text
'2008'

4), cũng như thêm trẻ em mới (ví dụ với

>>> root[0][1].text
'2008'

5).

Hãy nói rằng chúng tôi muốn thêm một vào cấp bậc của mỗi quốc gia và thêm thuộc tính

>>> root[0][1].text
'2008'

6 vào phần tử cấp bậc:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

1

XML của chúng tôi bây giờ trông như thế này:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

2

Chúng ta có thể loại bỏ các phần tử bằng

>>> root[0][1].text
'2008'

7. Hãy nói rằng chúng tôi muốn loại bỏ tất cả các quốc gia với thứ hạng cao hơn 50:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

3

Lưu ý rằng sửa đổi đồng thời trong khi lặp lại có thể dẫn đến các vấn đề, giống như khi lặp lại và sửa đổi danh sách python hoặc dicts. Do đó, ví dụ đầu tiên thu thập tất cả các yếu tố phù hợp với

>>> root[0][1].text
'2008'

8 và chỉ sau đó lặp lại trong danh sách các trận đấu.

XML của chúng tôi bây giờ trông như thế này:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

4

Chúng ta có thể loại bỏ các phần tử bằng >>> root[0][1].text '2008' 7. Hãy nói rằng chúng tôi muốn loại bỏ tất cả các quốc gia với thứ hạng cao hơn 50:

Lưu ý rằng sửa đổi đồng thời trong khi lặp lại có thể dẫn đến các vấn đề, giống như khi lặp lại và sửa đổi danh sách python hoặc dicts. Do đó, ví dụ đầu tiên thu thập tất cả các yếu tố phù hợp với

>>> root[0][1].text
'2008'

8 và chỉ sau đó lặp lại trong danh sách các trận đấu.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

5

Xây dựng tài liệu XML

Hàm

>>> root[0][1].text
'2008'

9 cũng cung cấp một cách thuận tiện để tạo các phần tử phụ mới cho một phần tử đã cho:

Phân tích cú pháp XML với không gian tên

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

6

Nếu đầu vào XML có không gian tên, thẻ và thuộc tính có tiền tố ở dạng

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

0 sẽ được mở rộng thành

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

1 trong đó tiền tố được thay thế bằng URI đầy đủ. Ngoài ra, nếu có một không gian tên mặc định, rằng URI đầy đủ đó sẽ được chuẩn bị cho tất cả các thẻ không có lỗi.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

7

Dưới đây là một ví dụ XML kết hợp hai không gian tên, một với tiền tố hư cấu và cái còn lại là không gian tên mặc định:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

8

Một cách để tìm kiếm và khám phá ví dụ XML này là thêm thủ công URI vào mọi thẻ hoặc thuộc tính trong XPath của

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

2 hoặc

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

3:

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

9

Một cách tốt hơn để tìm kiếm ví dụ XML theo tên là tạo một từ điển với các tiền tố của riêng bạn và sử dụng chúng trong các chức năng tìm kiếm:

Hai cách tiếp cận này cả hai đầu ra:

Hỗ trợ Xpath¶

Mô -đun này cung cấp hỗ trợ hạn chế cho các biểu thức XPath để định vị các phần tử trong cây. Mục tiêu là hỗ trợ một tập hợp con nhỏ của cú pháp viết tắt; Một động cơ XPath đầy đủ nằm ngoài phạm vi của mô -đun.Parsing XML section:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

0

Thí dụ¶



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

1

Ở đây, một ví dụ chứng minh một số khả năng XPath của mô -đun. Chúng tôi sẽ sử dụng tài liệu XML >>> parser = ET.XMLPullParser(['start', 'end']) >>> parser.feed('sometext') >>> list(parser.read_events()) [('start', )] >>> parser.feed(' more text') >>> for event, elem in parser.read_events(): ... print(event) ... print(elem.tag, 'text=', elem.text) ... end 4 từ phần phân tích cú pháp XML:

Đối với XML có không gian tên, hãy sử dụng ký hiệu

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

5 đủ điều kiện thông thường:

Hỗ trợ Xpath Cú pháp

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

6

Cú pháp

NghĩaSupport for star-wildcards was added.

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

6

Chọn tất cả các phần tử con với thẻ đã cho. Ví dụ,

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

7 chọn tất cả các yếu tố con có tên

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

7 và

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

9 chọn tất cả các cháu có tên

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

0 ở tất cả trẻ em có tên

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

7.

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

2 Chọn tất cả các thẻ trong không gian tên đã cho,

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

3 chọn các thẻ có tên

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

7 trong bất kỳ (hoặc không) không gian tên và

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

5 chỉ chọn các thẻ không có trong không gian tên.

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

9

Thay đổi trong phiên bản 3.8: Hỗ trợ cho Star-Wildcards đã được thêm vào.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

00

Chọn tất cả các yếu tố trẻ em, bao gồm cả ý kiến và hướng dẫn xử lý. Ví dụ,

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

7 chọn tất cả các cháu có tên

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

0.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

03

Chọn nút hiện tại. Điều này chủ yếu là hữu ích ở đầu đường dẫn, để chỉ ra rằng nó là một con đường tương đối.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

06

Chọn tất cả các phần mềm, trên tất cả các cấp bên dưới phần tử hiện tại. Ví dụ,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

01 chọn tất cả các phần tử

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

0 trong toàn bộ cây.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

07

Chọn phần tử cha. Trả về

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 Nếu đường dẫn cố gắng tiếp cận tổ tiên của phần tử bắt đầu (phần tử

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

05 đã được gọi).

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

08

Chọn tất cả các yếu tố có thuộc tính đã cho.

Chọn tất cả các yếu tố mà thuộc tính đã cho có giá trị đã cho. Giá trị không thể chứa trích dẫn.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

09

Chọn tất cả các yếu tố mà thuộc tính đã cho không có giá trị đã cho. Giá trị không thể chứa trích dẫn.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

11

Mới trong phiên bản 3.10.

Chọn tất cả các yếu tố có một đứa trẻ tên

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

6. Chỉ có trẻ em ngay lập tức được hỗ trợ.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

13

Chọn tất cả các yếu tố có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, bằng với

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

12 đã cho.

Chọn tất cả các yếu tố mà thuộc tính đã cho có giá trị đã cho. Giá trị không thể chứa trích dẫn.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

15

Chọn tất cả các yếu tố mà thuộc tính đã cho không có giá trị đã cho. Giá trị không thể chứa trích dẫn.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

18

Mới trong phiên bản 3.10.

Chọn tất cả các yếu tố mà thuộc tính đã cho có giá trị đã cho. Giá trị không thể chứa trích dẫn.

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

21

Chọn tất cả các yếu tố mà thuộc tính đã cho không có giá trị đã cho. Giá trị không thể chứa trích dẫn.

Mới trong phiên bản 3.10.

Tài liệu tham khảo¶

Chức năng¶

xml.etree.elementtree.canonicalize (xml_data = none, *, out = none, from_file = none, ** Tùy chọn)canonicalize(xml_data=None, *, out=None, from_file=None, **options)¶

Hàm chuyển đổi C14N 2.0.

Canonicalization là một cách để bình thường hóa đầu ra XML theo cách cho phép so sánh byte-byte và chữ ký số. Nó làm giảm sự tự do mà các serializer XML có và thay vào đó tạo ra một biểu diễn XML bị ràng buộc hơn. Các hạn chế chính liên quan đến việc sắp xếp các khai báo không gian tên, thứ tự các thuộc tính và khoảng trắng không thể tin được.

Hàm này lấy chuỗi dữ liệu XML (xml_data) hoặc đường dẫn tệp hoặc đối tượng giống như tệp (từ_file) làm đầu vào, chuyển đổi nó thành dạng chính tắc và viết nó ra bằng đối tượng tệp (giống như), nếu được cung cấp hoặc Trả về nó dưới dạng chuỗi văn bản nếu không. Tệp đầu ra nhận văn bản, không phải byte. Do đó, nó nên được mở trong chế độ văn bản với mã hóa

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

25.

Sử dụng điển hình:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

2

Các tùy chọn cấu hình như sau:

with_comments: được đặt thành true để bao gồm các nhận xét (mặc định: false)
Strip_Text: Đặt thành True thành Dải khoảng trắng trước và sau khi nội dung văn bản
(Mặc định: Sai)
viết lại_prefixes: Đặt thành TRUE để thay thế các tiền tố không gian tên bằng cách N {number},
(Mặc định: Sai)
viết lại_prefixes: Đặt thành TRUE để thay thế các tiền tố không gian tên bằng cách N {number},
qname_aware_tags: một tập hợp các tên thẻ nhận biết qName trong đó tiền tố
nên được thay thế trong nội dung văn bản (mặc định: trống)
qname_aware_tags: một tập hợp các tên thẻ nhận biết qName trong đó tiền tố
nên được thay thế trong nội dung văn bản (mặc định: trống)
Qname_Aware_attrs: Một tập hợp các tên thuộc tính Aware Qname trong đó các tiền tố

loại trừ_attrs: một tập hợp các tên thuộc tính không nên tuần tự hóa

exclude_tags: một tập hợp các tên thẻ không nên tuần tự hóa

Trong danh sách tùy chọn ở trên, một bộ một bộ khác đề cập đến bất kỳ bộ sưu tập hoặc không thể điều chỉnh được, không có sự đặt hàng nào được mong đợi.

Mới trong phiên bản 3.8.

Bình luận Nhà máy yếu tố. Chức năng nhà máy này tạo ra một yếu tố đặc biệt sẽ được tuần tự hóa dưới dạng bình luận XML của bộ tuần tự tiêu chuẩn. Chuỗi nhận xét có thể là một chuỗi bytestring hoặc một chuỗi unicode. Văn bản là một chuỗi chứa chuỗi nhận xét. Trả về một thể hiện yếu tố đại diện cho một bình luận.dump(elem)¶

Lưu ý rằng

>>> root.tag
'data'
>>> root.attrib
{}

6 bỏ qua các bình luận trong đầu vào thay vì tạo các đối tượng bình luận cho chúng. Một

root = ET.fromstring(country_data_as_string)

6 sẽ chỉ chứa các nút bình luận nếu chúng được đưa vào cây bằng một trong các phương thức

root = ET.fromstring(country_data_as_string)

7.

xml.etree.elementtree.dump (elem) ¶

Viết một cây phần tử hoặc cấu trúc phần tử vào sys.stdout. Chức năng này chỉ nên được sử dụng để gỡ lỗi.

Định dạng đầu ra chính xác là phụ thuộc thực hiện. Trong phiên bản này, nó được viết dưới dạng tệp XML thông thường.The

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

29 function now preserves the attribute order specified by the user.

Elem là một cây phần tử hoặc một phần tử riêng lẻ.fromstring(text, parser=None)¶

Đã thay đổi trong phiên bản 3.8: Hàm

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

29 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.

xml.etree.elementtree.fromString (văn bản, trình phân tích cú pháp = không) ¶fromstringlist(sequence, parser=None)¶

Phân tích phần XML từ hằng số chuỗi. Giống như

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

30. Văn bản là một chuỗi chứa dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> root.tag
'data'
>>> root.attrib
{}

6 tiêu chuẩn được sử dụng. Trả về một ví dụ

root = ET.fromstring(country_data_as_string)

7.

xml.etree.elementtree.fromStringList (trình tự, trình phân tích cú pháp = none) ¶

Phân tích một tài liệu XML từ một chuỗi các đoạn chuỗi. Trình tự là một danh sách hoặc chuỗi khác chứa các đoạn dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> root.tag
'data'
>>> root.attrib
{}

6 tiêu chuẩn được sử dụng. Trả về một ví dụ

root = ET.fromstring(country_data_as_string)

7.indent(tree, space=' ', level=0)¶

Mới trong phiên bản 3.2.

xml.etree.elementtree.indent (cây, space = '& nbsp;', level = 0) ¶

Lối nhiều khoảng trắng vào cây con để thụt vào cây một cách trực quan. Điều này có thể được sử dụng để tạo ra đầu ra XML được in khá đẹp. cây có thể là một yếu tố hoặc phần tử. Không gian là chuỗi khoảng trắng sẽ được chèn cho từng cấp độ thụt, hai ký tự không gian theo mặc định. Để thụt lề một phần bên trong của một cây đã thụt vào, vượt qua mức thụt đầu tiên dưới dạng cấp độ.iselement(element)¶

Mới trong phiên bản 3.9.

xml.etree.elementtree.iselement (phần tử) ¶iterparse(source, events=None, parser=None)¶

Kiểm tra xem một đối tượng dường như là một đối tượng phần tử hợp lệ. Phần tử là một thể hiện yếu tố. Trả về

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

35 nếu đây là một đối tượng phần tử.file object containing XML data. events is a sequence of events to report back. The supported events are the strings

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

36,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

37,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

38,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

39,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

40 and

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

41 (the “ns” events are used to get detailed namespace information). If events is omitted, only

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

37 events are reported. parser is an optional parser instance. If not given, the standard

>>> root.tag
'data'
>>> root.attrib
{}

6 parser is used. parser must be a subclass of

>>> root.tag
'data'
>>> root.attrib
{}

6 and can only use the default

>>> root.tag
'data'
>>> root.attrib
{}

5 as a target. Returns an iterator providing

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

46 pairs.

Lưu ý rằng trong khi

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

3 xây dựng cây dần dần, nó có sự cố chặn đọc trên nguồn (hoặc tên tệp nó). Do đó, nó không phù hợp với các ứng dụng trong đó việc chặn các lần đọc có thể được thực hiện. Để biết phân tích hoàn toàn không chặn, xem

>>> root.tag
'data'
>>> root.attrib
{}

9.

Ghi chú

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

3 chỉ đảm bảo rằng nó đã nhìn thấy ký tự>> của một thẻ bắt đầu khi nó phát ra sự kiện bắt đầu, vì vậy các thuộc tính được xác định, nhưng nội dung của các thuộc tính văn bản và đuôi không được xác định tại điểm đó. Điều tương tự áp dụng cho trẻ em yếu tố; Họ có thể hoặc không thể có mặt.

Nếu bạn cần một yếu tố điền kinh hoàn toàn, thay vào đó, hãy tìm các sự kiện về kết thúc.

Không dùng nữa kể từ phiên bản 3.4: Đối số phân tích cú pháp.The parser argument.

Thay đổi trong phiên bản 3.8: Các sự kiện

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

50 và

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

51 đã được thêm vào.The

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

50 and

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

51 events were added.

xml.etree.elementtree.parse (nguồn, trình phân tích cú pháp = không) ¶parse(source, parser=None)¶

Phân tích phần XML vào một cây phần tử. Nguồn là tên tệp hoặc đối tượng tệp chứa dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> root.tag
'data'
>>> root.attrib
{}

6 tiêu chuẩn được sử dụng. Trả về một ví dụ

root = ET.fromstring(country_data_as_string)

6.

xml.etree.elementtree.processingInstration (Target, text = none) ¶ProcessingInstruction(target, text=None)¶

Nhà máy nguyên tố PI. Chức năng nhà máy này tạo ra một yếu tố đặc biệt sẽ được tuần tự hóa dưới dạng hướng dẫn xử lý XML. Mục tiêu là một chuỗi chứa mục tiêu PI. Văn bản là một chuỗi chứa nội dung PI, nếu được đưa ra. Trả về một thể hiện phần tử, đại diện cho một lệnh xử lý.

Lưu ý rằng

>>> root.tag
'data'
>>> root.attrib
{}

6 bỏ qua các hướng dẫn xử lý trong đầu vào thay vì tạo các đối tượng nhận xét cho chúng. Một

root = ET.fromstring(country_data_as_string)

6 sẽ chỉ chứa các nút lệnh xử lý nếu chúng được đưa vào cây bằng một trong các phương thức

root = ET.fromstring(country_data_as_string)

7.

xml.etree.elementtree.register_namespace (tiền tố, uri) ¶register_namespace(prefix, uri)¶

Đăng ký một tiền tố không gian tên. Cơ quan đăng ký là toàn cầu và bất kỳ ánh xạ hiện có nào cho tiền tố đã cho hoặc URI không gian tên sẽ bị xóa. Tiền tố là tiền tố không gian tên. URI là một không gian tên Uri. Các thẻ và các thuộc tính trong không gian tên này sẽ được tuần tự hóa với tiền tố đã cho, nếu có thể.

Mới trong phiên bản 3.2.

xml.etree.elementtree.subelement (cha mẹ, tag, attribe = {}, ** thêm) ¶SubElement(parent, tag, attrib={}, **extra)¶

Nhà máy Subelement. Hàm này tạo ra một thể hiện phần tử và nối nó vào một phần tử hiện có.

Tên phần tử, tên thuộc tính và giá trị thuộc tính có thể là chuỗi bytestrings hoặc unicode. Cha mẹ là yếu tố cha mẹ. Tag là tên subelement. Attrible là một từ điển tùy chọn, chứa các thuộc tính phần tử. Thêm chứa các thuộc tính bổ sung, được đưa ra dưới dạng đối số từ khóa. Trả về một thể hiện phần tử.

xml.etree.elementtree.tostring (phần tử, mã hóa = 'us-ascii', meather = 'xml', *, xml_declaration = nonetostring(element, encoding='us-ascii', method='xml', *, xml_declaration=None, default_namespace=None, short_empty_elements=True)¶

Tạo một biểu diễn chuỗi của một phần tử XML, bao gồm tất cả các phần mềm. Phần tử là một ví dụ

root = ET.fromstring(country_data_as_string)

7. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). Sử dụng

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

58 để tạo chuỗi unicode (nếu không, một bytestring được tạo ra). Phương thức là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

60 hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

61 (mặc định là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59). xml_declaration, default_namespace và short_empty_elements có cùng ý nghĩa như trong

>>> root[0][1].text
'2008'

1. Trả về một chuỗi được mã hóa (tùy chọn) chứa dữ liệu XML.

Mới trong phiên bản 3.4: Tham số Short_empty_elements.The short_empty_elements parameter.

Mới trong phiên bản 3.8: Các tham số XML_Declaration và Default_namespace.The xml_declaration and default_namespace parameters.

Đã thay đổi trong phiên bản 3.8: Hàm

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

64 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.The

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

64 function now preserves the attribute order specified by the user.

xml.etree.elementtree.tostringlist (phần tử, mã hóa = 'us-ascii', meather = 'xml', *, xml_declaration = nonetostringlist(element, encoding='us-ascii', method='xml', *, xml_declaration=None, default_namespace=None, short_empty_elements=True)¶

Tạo một biểu diễn chuỗi của một phần tử XML, bao gồm tất cả các phần mềm. Phần tử là một ví dụ

root = ET.fromstring(country_data_as_string)

7. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). Sử dụng

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

58 để tạo chuỗi unicode (nếu không, một bytestring được tạo ra). Phương thức là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

60 hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

61 (mặc định là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59). xml_declaration, default_namespace và short_empty_elements có cùng ý nghĩa như trong

>>> root[0][1].text
'2008'

1. Trả về một danh sách các chuỗi được mã hóa (tùy chọn) chứa dữ liệu XML. Nó không đảm bảo bất kỳ chuỗi cụ thể nào, ngoại trừ

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

72.

Mới trong phiên bản 3.2.

Mới trong phiên bản 3.4: Tham số Short_empty_elements.The short_empty_elements parameter.

Mới trong phiên bản 3.8: Các tham số XML_Declaration và Default_namespace.The xml_declaration and default_namespace parameters.

Đã thay đổi trong phiên bản 3.8: Hàm

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

64 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.The

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

73 function now preserves the attribute order specified by the user.

xml.etree.elementtree.tostringlist (phần tử, mã hóa = 'us-ascii', meather = 'xml', *, xml_declaration = noneXML(text, parser=None)¶

Tạo một biểu diễn chuỗi của một phần tử XML, bao gồm tất cả các phần mềm. Phần tử là một ví dụ

root = ET.fromstring(country_data_as_string)

7. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). Sử dụng

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

58 để tạo chuỗi unicode (nếu không, một bytestring được tạo ra). Phương thức là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

60 hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

61 (mặc định là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59). xml_declaration, default_namespace và short_empty_elements có cùng ý nghĩa như trong

>>> root[0][1].text
'2008'

1. Trả về một danh sách các chuỗi được mã hóa (tùy chọn) chứa dữ liệu XML. Nó không đảm bảo bất kỳ chuỗi cụ thể nào, ngoại trừ

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

72.

xml.etree.elementtree.xmlid (văn bản, trình phân tích cú pháp = không) ¶XMLID(text, parser=None)¶

Phân tích phần XML từ hằng số chuỗi và cũng trả về một từ điển ánh xạ từ phần tử ID: S sang các phần tử. Văn bản là một chuỗi chứa dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> root.tag
'data'
>>> root.attrib
{}

6 tiêu chuẩn được sử dụng. Trả về một tuple chứa một thể hiện

root = ET.fromstring(country_data_as_string)

7 và từ điển.

Hỗ trợ Xinclude

Mô -đun này cung cấp hỗ trợ hạn chế cho các chỉ thị xinclude, thông qua mô -đun trợ giúp

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

78. Mô -đun này có thể được sử dụng để chèn các cây con và chuỗi văn bản vào các cây phần tử, dựa trên thông tin trong cây.

Thí dụ¶

Ở đây, một ví dụ chứng minh việc sử dụng mô -đun xinclude. Để bao gồm một tài liệu XML trong tài liệu hiện tại, hãy sử dụng phần tử

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

79 và đặt thuộc tính phân tích cú pháp thành

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59 và sử dụng thuộc tính HREF để chỉ định tài liệu để bao gồm.parse attribute to

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59, and use the href attribute to specify the document to include.



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

3

Theo mặc định, thuộc tính HREF được coi là tên tệp. Bạn có thể sử dụng trình tải tùy chỉnh để ghi đè hành vi này. Cũng lưu ý rằng người trợ giúp tiêu chuẩn không hỗ trợ cú pháp XPOUNIN.href attribute is treated as a file name. You can use custom loaders to override this behaviour. Also note that the standard helper does not support XPointer syntax.

Để xử lý tệp này, hãy tải nó như bình thường và chuyển phần tử gốc đến mô -đun

root = ET.fromstring(country_data_as_string)

1:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

4

Mô -đun ElementInClude thay thế phần tử

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

79 bằng phần tử gốc từ tài liệu Source.xml. Kết quả có thể trông giống như thế này:source.xml document. The result might look something like this:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

5

Nếu thuộc tính phân tích cú pháp bị bỏ qua, nó mặc định là XML XML. Thuộc tính HREF là bắt buộc.parse attribute is omitted, it defaults to “xml”. The href attribute is required.

Để bao gồm một tài liệu văn bản, hãy sử dụng phần tử

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

79 và đặt thuộc tính phân tích cú pháp thành văn bản trực tuyến:parse attribute to “text”:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

6

Kết quả có thể trông giống như:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

7

Tài liệu tham khảo¶

Chức năng¶

xml.etree.elementinclude.default_loader (href, parse, mã hóa = none) ¶default_loader(href, parse, encoding=None)¶

Trình tải mặc định. Trình tải mặc định này đọc một tài nguyên bao gồm từ đĩa. href là một url. Parse là cho chế độ phân tích cú pháp hoặc là XML, hoặc văn bản. Mã hóa là một mã hóa văn bản tùy chọn. Nếu không được đưa ra, mã hóa là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

25. Trả về tài nguyên mở rộng. Nếu chế độ phân tích phân tích là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59, đây là một thể hiện ElementTree. Nếu chế độ phân tích cú pháp là văn bản, thì đây là một chuỗi unicode. Nếu trình tải không thành công, nó có thể trả về không hoặc tăng ngoại lệ.

xml.etree.elementinclude.include (elem, loader = none, base_url = none, max_depth = 6) ¶include(elem, loader=None, base_url=None, max_depth=6)¶

Hàm này mở rộng chỉ thị Xinclude. Elem là yếu tố gốc. Trình tải là một trình tải tài nguyên tùy chọn. Nếu bị bỏ qua, nó mặc định là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

86. Nếu được đưa ra, nó phải là một cuộc gọi có thể thực hiện cùng giao diện với

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

86. Base_URL là URL cơ sở của tệp gốc, để giải quyết tương đối bao gồm các tham chiếu tệp. MAX_DEPTH là số lượng vùi đệ quy tối đa. Giới hạn để giảm nguy cơ nổ nội dung độc hại. Vượt qua một giá trị âm để vô hiệu hóa giới hạn.

Trả về tài nguyên mở rộng. Nếu chế độ phân tích phân tích là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59, đây là một thể hiện ElementTree. Nếu chế độ phân tích cú pháp là văn bản, thì đây là một chuỗi unicode. Nếu trình tải không thành công, nó có thể trả về không hoặc tăng ngoại lệ.

Mới trong phiên bản 3.9: Các tham số Base_URL và MAX_DEPTH.The base_url and max_depth parameters.

Đối tượng phần tử

classxml.etree.elementtree.element (tag, attribe = {}, ** thêm) ¶ xml.etree.ElementTree.Element(tag, attrib={}, **extra)¶

Lớp phần tử. Lớp này xác định giao diện phần tử và cung cấp triển khai tham chiếu của giao diện này.

Tên phần tử, tên thuộc tính và giá trị thuộc tính có thể là chuỗi bytestrings hoặc unicode. Tag là tên phần tử. Attrible là một từ điển tùy chọn, chứa các thuộc tính phần tử. Thêm chứa các thuộc tính bổ sung, được đưa ra dưới dạng đối số từ khóa.

nhãn¶¶

Một chuỗi xác định loại dữ liệu mà phần tử này biểu diễn (loại phần tử, nói cách khác).

Text¶ Tail¶¶ tail¶

Các thuộc tính này có thể được sử dụng để chứa dữ liệu bổ sung được liên kết với phần tử. Giá trị của chúng thường là chuỗi nhưng có thể là bất kỳ đối tượng dành riêng cho ứng dụng. Nếu phần tử được tạo từ tệp XML, thuộc tính văn bản sẽ giữ văn bản giữa thẻ bắt đầu của phần tử và thẻ con đầu tiên hoặc thẻ cuối , hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04. Đối với dữ liệu XML



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

8

Phần tử A có

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 cho cả thuộc tính văn bản và đuôi, phần tử B có văn bản

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

92 và đuôi

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

93, phần tử C có văn bản

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

94 và đuôi

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04, và phần tử D có văn bản

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 và đuôi

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

97.

Để thu thập văn bản bên trong của một phần tử, hãy xem

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

98, ví dụ

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

99.

Các ứng dụng có thể lưu trữ các đối tượng tùy ý trong các thuộc tính này.

thuộc về thuộc về¶

Một từ điển chứa các thuộc tính của phần tử. Lưu ý rằng trong khi giá trị thuộc tính luôn là một từ điển Python có thể thay đổi thực sự, nhưng việc triển khai ElementTree có thể chọn sử dụng một biểu diễn nội bộ khác và chỉ tạo từ điển nếu ai đó yêu cầu nó. Để tận dụng các triển khai như vậy, hãy sử dụng các phương thức từ điển dưới đây bất cứ khi nào có thể.

Các phương thức giống như từ điển hoạt động trên các thuộc tính phần tử.

xa lạ()¶()¶

Đặt lại một yếu tố. Hàm này loại bỏ tất cả các phần mềm, xóa tất cả các thuộc tính và đặt các thuộc tính văn bản và đuôi thành

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04.

Nhận (khóa, mặc định = Không) ¶(key, default=None)¶

Nhận thuộc tính phần tử có tên là khóa.

Trả về giá trị thuộc tính hoặc mặc định nếu không tìm thấy thuộc tính.

mặt hàng()¶()¶

Trả về các thuộc tính phần tử như một chuỗi của các cặp (tên, giá trị). Các thuộc tính được trả về theo thứ tự tùy ý.

chìa khóa () ¶()¶

Trả về tên thuộc tính phần tử làm danh sách. Các tên được trả lại theo thứ tự tùy ý.

Đặt (khóa, giá trị)(key, value)¶

Đặt phím thuộc tính trên phần tử thành giá trị.

Các phương pháp sau đây hoạt động trên các yếu tố trẻ em (phụ).

ốp sắt (subelement) ¶(subelement)¶

Thêm phần tử SubSement vào cuối danh sách nội bộ của phần tử này. Tăng



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

01 nếu Subelement không phải là

root = ET.fromstring(country_data_as_string)

7.

Mở rộng (SubErements) ¶(subelements)¶

Nối các phần mềm từ một đối tượng chuỗi bằng 0 hoặc nhiều phần tử. Tăng



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

01 nếu một Subelement không phải là

root = ET.fromstring(country_data_as_string)

7.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶(match, namespaces=None)¶

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns an element instance or

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04. namespaces is an optional mapping from namespace prefix to full name. Pass



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 as prefix to move all unprefixed tag names in the expression into the given namespace.

Findall (khớp, không gian tên = không) ¶(match, namespaces=None)¶

Tìm tất cả các phần mềm phù hợp, theo tên thẻ hoặc đường dẫn. Trả về một danh sách chứa tất cả các yếu tố phù hợp theo thứ tự tài liệu. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns a list containing all matching elements in document order. namespaces is an optional mapping from namespace prefix to full name. Pass



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 as prefix to move all unprefixed tag names in the expression into the given namespace.

FindText (khớp, mặc định = không, không gian tên = none) ¶(match, default=None, namespaces=None)¶

Tìm văn bản cho trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về nội dung văn bản của phần tử khớp đầu tiên hoặc mặc định nếu không tìm thấy phần tử nào. Lưu ý rằng nếu phần tử phù hợp không có nội dung văn bản, một chuỗi trống được trả về. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns the text content of the first matching element, or default if no element was found. Note that if the matching element has no text content an empty string is returned. namespaces is an optional mapping from namespace prefix to full name. Pass



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 as prefix to move all unprefixed tag names in the expression into the given namespace.

Chèn (INDEX, SUPEuity) ¶(index, subelement)¶

Chèn SubLement tại vị trí đã cho trong yếu tố này. Tăng



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

01 nếu Subelement không phải là

root = ET.fromstring(country_data_as_string)

7.

iter (tag = none) ¶(tag=None)¶

Tạo một bộ lặp cây với phần tử hiện tại là gốc. Trình lặp lặp lại trên phần tử này và tất cả các phần tử bên dưới nó, theo thứ tự tài liệu (độ sâu đầu tiên). Nếu thẻ không phải là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 hoặc



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

12, chỉ các phần tử có thẻ bằng thẻ được trả về từ trình lặp. Nếu cấu trúc cây được sửa đổi trong quá trình lặp, kết quả không được xác định.iterator with the current element as the root. The iterator iterates over this element and all elements below it, in document (depth first) order. If tag is not

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 or



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

12, only elements whose tag equals tag are returned from the iterator. If the tree structure is modified during iteration, the result is undefined.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶(match, namespaces=None)¶

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns an iterable yielding all matching elements in document order. namespaces is an optional mapping from namespace prefix to full name.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶()¶

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶(tag, attrib)¶

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

Findall (khớp, không gian tên = không) ¶(subelement)¶

Tìm tất cả các phần mềm phù hợp, theo tên thẻ hoặc đường dẫn. Trả về một danh sách chứa tất cả các yếu tố phù hợp theo thứ tự tài liệu. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

FindText (khớp, mặc định = không, không gian tên = none) ¶

Tìm văn bản cho trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về nội dung văn bản của phần tử khớp đầu tiên hoặc mặc định nếu không tìm thấy phần tử nào. Lưu ý rằng nếu phần tử phù hợp không có nội dung văn bản, một chuỗi trống được trả về. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

9

Chèn (INDEX, SUPEuity) ¶

Chèn SubLement tại vị trí đã cho trong yếu tố này. Tăng



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

01 nếu Subelement không phải là

root = ET.fromstring(country_data_as_string)

7.

iter (tag = none) ¶

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

0

Đối tượng ElementTree

classxml.etree.elementtree.elementtree (phần tử = none, file = none) ¶ xml.etree.ElementTree.ElementTree(element=None, file=None)¶

Lớp trình bao bọc ElementTree. Lớp này đại diện cho toàn bộ hệ thống phân cấp phần tử và thêm một số hỗ trợ bổ sung cho việc tuần tự hóa đến và từ XML tiêu chuẩn.

Phần tử là phần tử gốc. Cây được khởi tạo với nội dung của tệp XML nếu được đưa ra.

_setroot (phần tử) ¶(element)¶

Thay thế phần tử gốc cho cây này. Điều này loại bỏ các nội dung hiện tại của cây và thay thế nó bằng phần tử đã cho. Sử dụng một cách cẩn thận. Phần tử là một thể hiện yếu tố.

Tìm (khớp, không gian tên = Không) ¶(match, namespaces=None)¶

Giống như

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

7, bắt đầu từ gốc của cây.

Findall (khớp, không gian tên = không) ¶(match, namespaces=None)¶

Giống như

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

6, bắt đầu từ gốc của cây.

FindText (khớp, mặc định = không, không gian tên = none) ¶(match, default=None, namespaces=None)¶

Giống như



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

25, bắt đầu từ gốc của cây.

getroot () ¶()¶

Trả về phần tử gốc cho cây này.

iter (tag = none) ¶(tag=None)¶

Tạo và trả về một bộ lặp cây cho phần tử gốc. Các vòng lặp lặp trên tất cả các yếu tố trong cây này, theo thứ tự phần. Tag là thẻ để tìm kiếm (mặc định là trả về tất cả các yếu tố).

iterfind (khớp, không gian tên = không) ¶(match, namespaces=None)¶

Giống như



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

26, bắt đầu từ gốc của cây.

Mới trong phiên bản 3.2.

Parse (Nguồn, trình phân tích cú pháp = Không) ¶(source, parser=None)¶

Tải phần XML bên ngoài vào cây phần tử này. Nguồn là tên tệp hoặc đối tượng tệp. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> root.tag
'data'
>>> root.attrib
{}

6 tiêu chuẩn được sử dụng. Trả về phần phần tử gốc.file object. parser is an optional parser instance. If not given, the standard

>>> root.tag
'data'
>>> root.attrib
{}

6 parser is used. Returns the section root element.

Viết (Tệp, mã hóa = 'us-ascii', xml_declaration = none, default_namespace = none, meather = 'xml', *, short_empty_elements = true)(file, encoding='us-ascii', xml_declaration=None, default_namespace=None, method='xml', *, short_empty_elements=True)¶

Viết cây phần tử vào một tệp, như XML. Tệp là một tên tệp hoặc một đối tượng tệp được mở để viết. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). XML_Declaration điều khiển nếu sẽ được thêm khai báo XML vào tệp. Sử dụng



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

19 cho không bao giờ,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

35 luôn luôn,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 chỉ nếu không phải là US-ASCII hoặc UTF-8 hoặc Unicode (mặc định là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04). Default_namespace đặt không gian tên XML mặc định (đối với các loại XMLNS). Phương thức là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

60 hoặc

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

61 (mặc định là

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59). Tham số chỉ từ khóa chỉ ngắn hạn_empty_elements kiểm soát định dạng của các phần tử không chứa nội dung. Nếu

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

35 (mặc định), chúng được phát ra dưới dạng một thẻ tự đóng, nếu không chúng được phát ra dưới dạng một cặp thẻ bắt đầu/kết thúc.file object opened for writing. encoding 1 is the output encoding (default is US-ASCII). xml_declaration controls if an XML declaration should be added to the file. Use



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

19 for never,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

35 for always,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04 for only if not US-ASCII or UTF-8 or Unicode (default is

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

04). default_namespace sets the default XML namespace (for “xmlns”). method is either

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59,

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

60 or

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

61 (default is

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

59). The keyword-only short_empty_elements parameter controls the formatting of elements that contain no content. If

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

35 (the default), they are emitted as a single self-closed tag, otherwise they are emitted as a pair of start/end tags.

Đầu ra là một chuỗi (



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

37) hoặc nhị phân (



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

38). Điều này được kiểm soát bởi đối số mã hóa. Nếu mã hóa là



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

39, đầu ra là một chuỗi; Nếu không, nó nhị phân. Lưu ý rằng điều này có thể mâu thuẫn với loại tệp nếu nó là một đối tượng tệp mở; Hãy chắc chắn rằng bạn không cố gắng viết một chuỗi vào luồng nhị phân và ngược lại.file object; make sure you do not try to write a string to a binary stream and vice versa.

Mới trong phiên bản 3.4: Tham số Short_empty_elements.The short_empty_elements parameter.

Đã thay đổi trong phiên bản 3.8: Phương thức



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

40 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.The



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

40 method now preserves the attribute order specified by the user.

Đây là tệp XML sẽ bị thao túng:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

1

Ví dụ về việc thay đổi thuộc tính Target Target của mỗi liên kết trong đoạn đầu tiên:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

2

Đối tượng Qname

classxml.etree.elementtree.qname (text_or_uri, tag = none) ¶ xml.etree.ElementTree.QName(text_or_uri, tag=None)¶

QNAME WRAPPER. Điều này có thể được sử dụng để bọc giá trị thuộc tính Qname, để có được xử lý không gian tên thích hợp trên đầu ra. Text_or_uri là một chuỗi chứa giá trị qname, ở dạng {uri} cục bộ, hoặc, nếu đối số thẻ được đưa ra, phần URI của Qname. Nếu TAG được đưa ra, đối số đầu tiên được hiểu là một URI và đối số này được hiểu là một tên địa phương.



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

41 Các trường hợp mờ đục.

Đối tượng TreeBuilder

classxml.etree.elementtree.treeBuilder (Element_factory = none, *, bình luận_factory = none, pi_factory = none, insert_comments = false, insert_pis = false) xml.etree.ElementTree.TreeBuilder(element_factory=None, *, comment_factory=None, pi_factory=None, insert_comments=False, insert_pis=False)¶

Trình tạo cấu trúc phần tử chung. Nhà xây dựng này chuyển đổi một chuỗi bắt đầu, dữ liệu, kết thúc, nhận xét và phương thức PI gọi đến một cấu trúc phần tử được hình thành tốt. Bạn có thể sử dụng lớp này để xây dựng cấu trúc phần tử bằng trình phân tích cú pháp XML tùy chỉnh hoặc trình phân tích cú pháp cho một số định dạng giống như XML khác.

Element_Factory, khi được đưa ra, phải là một người có thể gọi là có thể chấp nhận hai đối số vị trí: một thẻ và một phương pháp của các thuộc tính. Dự kiến sẽ trả về một thể hiện yếu tố mới.

Các chức năng bình luận_factory và pi_factory, khi được đưa ra, nên hoạt động như các chức năng



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

42 và



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

43 để tạo nhận xét và hướng dẫn xử lý. Khi không được đưa ra, các nhà máy mặc định sẽ được sử dụng. Khi insert_comments và/hoặc insert_pis là đúng, nhận xét/pis sẽ được chèn vào cây nếu chúng xuất hiện trong phần tử gốc (nhưng không nằm ngoài nó).

gần()¶()¶

Xóa các bộ đệm xây dựng và trả về yếu tố tài liệu Toplevel. Trả về một ví dụ

root = ET.fromstring(country_data_as_string)

7.

Dữ liệu (dữ liệu) ¶(data)¶

Thêm văn bản vào phần tử hiện tại. Dữ liệu là một chuỗi. Điều này phải là một bytestring hoặc chuỗi unicode.

kết thúc (thẻ) ¶(tag)¶

Đóng phần tử hiện tại. Tag là tên phần tử. Trả về phần tử đóng.

Bắt đầu (Tag, attrs) ¶(tag, attrs)¶

Mở một yếu tố mới. Tag là tên phần tử. Attrs là một từ điển chứa các thuộc tính phần tử. Trả về phần tử đã mở.

Tạo một nhận xét với văn bản đã cho. Nếu



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

45 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶(target, text)¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

46 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

46 là đúng, điều này cũng sẽ thêm nó vào cây.(name, pubid, system)¶

Ngoài ra, một đối tượng

>>> root.tag
'data'
>>> root.attrib
{}

5 tùy chỉnh có thể cung cấp các phương thức sau:

doctype (tên, pubid, system) ¶

Xử lý một tuyên bố doctype. Tên là tên doctype. PubID là định danh công khai. Hệ thống là định danh hệ thống. Phương pháp này không tồn tại trên lớp

>>> root.tag
'data'
>>> root.attrib
{}

5 mặc định.(prefix, uri)¶

Mới trong phiên bản 3.2.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶(prefix)¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

46 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶xml.etree.ElementTree.C14NWriterTarget(write, *, with_comments=False, strip_text=False, rewrite_prefixes=False, qname_aware_tags=None, qname_aware_attrs=None, exclude_attrs=None, exclude_tags=None)¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

46 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

46 là đúng, điều này cũng sẽ thêm nó vào cây.xml.etree.ElementTree.XMLParser(*, target=None, encoding=None)¶

Ngoài ra, một đối tượng

>>> root.tag
'data'
>>> root.attrib
{}

5 tùy chỉnh có thể cung cấp các phương thức sau:

doctype (tên, pubid, system) ¶Parameters are now keyword-only. The html argument no longer supported.

Xử lý một tuyên bố doctype. Tên là tên doctype. PubID là định danh công khai. Hệ thống là định danh hệ thống. Phương pháp này không tồn tại trên lớp

>>> root.tag
'data'
>>> root.attrib
{}

5 mặc định.()¶

Mới trong phiên bản 3.2.

start_ns (tiền tố, uri) ¶(data)¶

Được gọi bất cứ khi nào trình phân tích cú pháp gặp phải một tuyên bố không gian tên mới, trước khi gọi lại



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

49 cho phần tử mở xác định nó. Tiền tố là



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 cho không gian tên mặc định và tên tiền tố không gian tên được khai báo khác. Uri là URI không gian tên.

end_ns (tiền tố) ¶

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

3

Được gọi sau khi gọi lại 1 2008 141100 4 2011 59900 68 2011 13600 51 của một phần tử đã khai báo ánh xạ tiền tố không gian tên, với tên của tiền tố đã đi ra khỏi phạm vi.

classxml.etree.elementtree.c14nwritertarget (write, *, with_comments = false xml.etree.ElementTree.XMLPullParser(events=None)¶

Một người viết C14N 2.0. Các đối số giống như đối với hàm



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

22. Lớp này không xây dựng một cây nhưng dịch các sự kiện gọi lại trực tiếp thành một dạng tuần tự bằng cách sử dụng hàm ghi.

start_ns (tiền tố, uri) ¶(data)¶

Được gọi bất cứ khi nào trình phân tích cú pháp gặp phải một tuyên bố không gian tên mới, trước khi gọi lại



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

49 cho phần tử mở xác định nó. Tiền tố là



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 cho không gian tên mặc định và tên tiền tố không gian tên được khai báo khác. Uri là URI không gian tên.

Xử lý một tuyên bố doctype. Tên là tên doctype. PubID là định danh công khai. Hệ thống là định danh hệ thống. Phương pháp này không tồn tại trên lớp

>>> root.tag
'data'
>>> root.attrib
{}

5 mặc định.()¶

Mới trong phiên bản 3.2.

start_ns (tiền tố, uri) ¶()¶

Được gọi bất cứ khi nào trình phân tích cú pháp gặp phải một tuyên bố không gian tên mới, trước khi gọi lại



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

49 cho phần tử mở xác định nó. Tiền tố là



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

06 cho không gian tên mặc định và tên tiền tố không gian tên được khai báo khác. Uri là URI không gian tên.

end_ns (tiền tố) ¶

Được gọi sau khi gọi lại



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

51 của một phần tử đã khai báo ánh xạ tiền tố không gian tên, với tên của tiền tố đã đi ra khỏi phạm vi.

classxml.etree.elementtree.c14nwritertarget (write, *, with_comments = false

Một người viết C14N 2.0. Các đối số giống như đối với hàm



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

22. Lớp này không xây dựng một cây nhưng dịch các sự kiện gọi lại trực tiếp thành một dạng tuần tự bằng cách sử dụng hàm ghi.

XMLPARSER Đối tượng

Ghi chú

>>> root.tag
'data'
>>> root.attrib
{}

9 chỉ đảm bảo rằng nó đã nhìn thấy ký tự>> của một thẻ bắt đầu khi nó phát ra sự kiện bắt đầu, vì vậy các thuộc tính được xác định, nhưng nội dung của các thuộc tính văn bản và đuôi không được xác định tại điểm đó. Điều tương tự áp dụng cho trẻ em yếu tố; Họ có thể hoặc không thể có mặt.

Nếu bạn cần một yếu tố điền kinh hoàn toàn, thay vào đó, hãy tìm các sự kiện về kết thúc.

Mới trong phiên bản 3.4.

Thay đổi trong phiên bản 3.8: Các sự kiện

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

50 và

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

51 đã được thêm vào.The

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

50 and

[OrderedDict([('Serial Number:', 'test'),
              ('Operator ID:', 'test1'),
              ('Time:', '00:03:47 Test Step 1'),
              ('TP1:', '17.25'),
              ('TP2:', '2.46')]),
 OrderedDict([('Serial Number:', ''),
              ('Operator ID:', 'test2'),
              ('Time:', '00:03:48 Test Step 2'),
              ('TP1:', '17.24'),
              ('TP2:', '2.47')])]

51 events were added.

Ngoại lệ ha

classxml.etree.elementtree.parseerror¶ xml.etree.ElementTree.ParseError¶

Lỗi phân tích cú pháp XML, được nâng lên bởi các phương pháp phân tích cú pháp khác nhau trong mô -đun này khi phân tích cú pháp bị lỗi. Biểu diễn chuỗi của một thể hiện của ngoại lệ này sẽ chứa thông báo lỗi thân thiện với người dùng. Ngoài ra, nó sẽ có sẵn các thuộc tính sau:

mã số¶¶

Một mã lỗi số từ trình phân tích cú pháp người nước ngoài. Xem tài liệu của



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>

53 để biết danh sách các mã lỗi và ý nghĩa của chúng.

Chức vụ¶¶

Một tuple của dòng, số cột, chỉ định nơi xảy ra lỗi.

Chú thích

1(1,2,3,4)(1,2,3,4)

Chuỗi mã hóa được bao gồm trong đầu ra XML phải phù hợp với các tiêu chuẩn thích hợp. Ví dụ, UTF-8 có hợp lệ, nhưng không phải là UTF8 thì thì không. Xem https://www.w3.org/tr/2006/rec-xml11-20060816/#nt-encodingdecl và https://www.iana.org/assignments/character-sets/character-sets.xhtml.

Làm cách nào để chuyển đổi tệp TXT thành XML?

Cách chuyển đổi TXT thành XML với phần mềm chuyển đổi tài liệu Doxillion..

Tải xuống phần mềm chuyển đổi tài liệu Doxillion. Tải xuống phần mềm chuyển đổi tài liệu Doxillion. ....

Nhập tệp TXT vào chương trình. ....

Chọn một thư mục đầu ra. ....

Đặt định dạng đầu ra. ....

Chuyển đổi TXT thành XML ..

Làm thế nào để bạn đọc một tệp văn bản trong XML trong Python?

Để đọc một tệp XML bằng ElementTree, trước tiên, chúng tôi nhập lớp ElementTree được tìm thấy bên trong thư viện XML, dưới tên ET (thông tin chung). Sau đó chuyển tên tệp của tệp XML cho ElementTree. Phương thức Parse (), để cho phép phân tích tệp XML của chúng tôi. Sau đó, nhận được gốc (thẻ cha) của tệp XML của chúng tôi bằng GetRoot ().

Làm thế nào để bạn phân tích XML trong Python?

Để phân tích tài liệu XML, bạn cần có toàn bộ tài liệu trong bộ nhớ ...

Để phân tích tài liệu XML ..

Nhập xml.dom.minidom ..

Sử dụng chức năng parse parse để phân tích cú pháp tài liệu (doc = xml.dom.minidom.parse (tên tệp) ;.

Gọi danh sách các thẻ XML từ tài liệu XML bằng mã (= doc.getelementsByTagName (tên tên của thẻ XML thẻ).

Làm thế nào để bạn thêm thẻ XML trong Python?

Thêm chúng bằng hàm subelement () và xác định thuộc tính văn bản của nó ...

con = xml.Phần tử ("nhân viên") nm = xml.Subelement (trẻ em, "Tên") nm.Văn bản = Sinh viên.....

Nhập XML.Etree.ElementTree là Et Tree = et.ElementTree (file = 'nhân viên.xml') root = cây.....

Nhập XML.Etree.ElementTree là Et Tree = et ..

programming python XML parser Python

Hướng dẫn python parse text file to xml - python phân tích cú pháp tệp văn bản thành xml

Hướng dẫn¶

Cây XML và các yếu tố

Phân tích cú pháp xml¶

Kéo API cho phân tích cú pháp không chặn

Tìm các yếu tố thú vị

Sửa đổi tệp XML

Chúng ta có thể loại bỏ các phần tử bằng >>> root[0][1].text '2008' 7. Hãy nói rằng chúng tôi muốn loại bỏ tất cả các quốc gia với thứ hạng cao hơn 50:

Xây dựng tài liệu XML

Một cách tốt hơn để tìm kiếm ví dụ XML theo tên là tạo một từ điển với các tiền tố của riêng bạn và sử dụng chúng trong các chức năng tìm kiếm:

Hỗ trợ Xpath¶

Tài liệu tham khảo¶

Chức năng¶

Hỗ trợ Xinclude

Thí dụ¶

Tài liệu tham khảo¶

Chức năng¶

Đối tượng phần tử

Đối tượng ElementTree

Đối tượng Qname

Đối tượng TreeBuilder

pi (mục tiêu, văn bản) ¶

Được gọi sau khi gọi lại 1 2008 141100 4 2011 59900 68 2011 13600 51 của một phần tử đã khai báo ánh xạ tiền tố không gian tên, với tên của tiền tố đã đi ra khỏi phạm vi.

Ngoại lệ ha

Làm cách nào để chuyển đổi tệp TXT thành XML?

Làm thế nào để bạn đọc một tệp văn bản trong XML trong Python?

Làm thế nào để bạn phân tích XML trong Python?

Làm thế nào để bạn thêm thẻ XML trong Python?

Bài Viết Liên Quan

Quảng Cáo

Có thể bạn quan tâm

Toplist được quan tâm

Quảng cáo

Xem Nhiều

Quảng cáo

Chúng tôi

Điều khoản

Trợ giúp

Mạng xã hội