Hướng dẫn how to parse xml file in python? - cách phân tích cú pháp tệp xml trong python?

Mã nguồn: lib/xml/etree/ElementTree.py Lib/xml/etree/ElementTree.py

Show

Mô -đun

>>> root.tag
'data'
>>> root.attrib
{}
2 thực hiện API đơn giản và hiệu quả để phân tích cú pháp và tạo dữ liệu XML.

Thay đổi trong phiên bản 3.3: Mô -đun này sẽ sử dụng triển khai nhanh bất cứ khi nào có sẵn.This module will use a fast implementation whenever available.

Không dùng nữa kể từ phiên bản 3.3: Mô -đun

>>> root.tag
'data'
>>> root.attrib
{}
3 được không dùng nữa.The
>>> root.tag
'data'
>>> root.attrib
{}
3 module is deprecated.

Hướng dẫn¶

Đây là một hướng dẫn ngắn để sử dụng

>>> root.tag
'data'
>>> root.attrib
{}
2 (ngắn gọn ____35). Mục tiêu là để chứng minh một số khối xây dựng và các khái niệm cơ bản của mô -đun.

Cây XML và các yếu tố

XML là một định dạng dữ liệu phân cấp vốn có và cách tự nhiên nhất để thể hiện nó là với một cây.

>>> root.tag
'data'
>>> root.attrib
{}
5 có hai lớp cho mục đích này -
>>> root.tag
'data'
>>> root.attrib
{}
7 đại diện cho toàn bộ tài liệu XML dưới dạng cây và
>>> root.tag
'data'
>>> root.attrib
{}
8 đại diện cho một nút duy nhất trong cây này. Các tương tác với toàn bộ tài liệu (đọc và ghi vào/từ các tệp) thường được thực hiện ở cấp độ
>>> root.tag
'data'
>>> root.attrib
{}
7. Các tương tác với một phần tử XML duy nhất và các phần tử phụ của nó được thực hiện ở cấp độ
>>> root.tag
'data'
>>> root.attrib
{}
8.

Phân tích cú pháp xml¶

Chúng tôi sẽ sử dụng tài liệu XML sau làm dữ liệu mẫu cho phần này:



     name="Liechtenstein">
        1
        2008
        141100
         name="Austria" direction="E"/>
         name="Switzerland" direction="W"/>
    
     name="Singapore">
        4
        2011
        59900
         name="Malaysia" direction="N"/>
    
     name="Panama">
        68
        2011
        13600
         name="Costa Rica" direction="W"/>
         name="Colombia" direction="E"/>
    

Chúng tôi có thể nhập dữ liệu này bằng cách đọc từ một tệp:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()

Hoặc trực tiếp từ một chuỗi:

root = ET.fromstring(country_data_as_string)

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
1 phân tích XML từ một chuỗi trực tiếp vào
>>> root.tag
'data'
>>> root.attrib
{}
8, là phần tử gốc của cây được phân tích cú pháp. Các chức năng phân tích cú pháp khác có thể tạo ra
>>> root.tag
'data'
>>> root.attrib
{}
7. Kiểm tra tài liệu để chắc chắn.

Là một

>>> root.tag
'data'
>>> root.attrib
{}
8,
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
5 có thẻ và từ điển thuộc tính:

>>> root.tag
'data'
>>> root.attrib
{}

Nó cũng có các nút trẻ em mà chúng ta có thể lặp lại:

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}

Trẻ em được lồng và chúng ta có thể truy cập các nút trẻ cụ thể bằng chỉ mục:

>>> root[0][1].text
'2008'

Ghi chú

Không phải tất cả các yếu tố của đầu vào XML sẽ kết thúc dưới dạng các phần tử của cây phân tích cú pháp. Hiện tại, mô -đun này bỏ qua mọi nhận xét XML, hướng dẫn xử lý và khai báo loại tài liệu trong đầu vào. Tuy nhiên, các cây được xây dựng bằng API mô -đun này thay vì phân tích cú pháp từ văn bản XML có thể có nhận xét và hướng dẫn xử lý trong đó; Chúng sẽ được bao gồm khi tạo ra đầu ra XML. Một khai báo loại tài liệu có thể được truy cập bằng cách chuyển một thể hiện tùy chỉnh ____46 cho hàm tạo

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7.

Kéo API cho phân tích cú pháp không chặn

Hầu hết các chức năng phân tích cú pháp được cung cấp bởi mô -đun này yêu cầu toàn bộ tài liệu được đọc cùng một lúc trước khi trả lại bất kỳ kết quả nào. Có thể sử dụng

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 và dữ liệu dữ liệu vào đó, nhưng đó là API đẩy gọi các phương thức trên mục tiêu gọi lại, mức độ quá thấp và bất tiện cho hầu hết các nhu cầu. Đôi khi những gì người dùng thực sự muốn là có thể phân tích XML tăng dần, mà không chặn các hoạt động, trong khi tận hưởng sự thuận tiện của các đối tượng
>>> root.tag
'data'
>>> root.attrib
{}
8 được xây dựng đầy đủ.

Công cụ mạnh mẽ nhất để làm điều này là

>>> root[0][1].text
'2008'
0. Nó không yêu cầu đọc chặn để có được dữ liệu XML và thay vào đó được cung cấp với dữ liệu tăng dần với các cuộc gọi
>>> root[0][1].text
'2008'
1. Để có được các phần tử XML được phân tích cú pháp, hãy gọi
>>> root[0][1].text
'2008'
2. Đây là một ví dụ:

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end

Trường hợp sử dụng rõ ràng là các ứng dụng hoạt động theo kiểu không chặn trong đó dữ liệu XML được nhận từ ổ cắm hoặc đọc tăng dần từ một số thiết bị lưu trữ. Trong những trường hợp như vậy, chặn đọc là không thể chấp nhận được.

Bởi vì nó rất linh hoạt,

>>> root[0][1].text
'2008'
0 có thể bất tiện để sử dụng cho các trường hợp sử dụng đơn giản hơn. Nếu bạn không quan tâm đến việc chặn ứng dụng của mình khi đọc dữ liệu XML nhưng vẫn muốn có khả năng phân tích cú pháp gia tăng, hãy xem
>>> root[0][1].text
'2008'
4. Nó có thể hữu ích khi bạn đọc một tài liệu XML lớn và không muốn giữ nó hoàn toàn trong bộ nhớ.

Tìm các yếu tố thú vị

>>> root.tag
'data'
>>> root.attrib
{}
8 có một số phương pháp hữu ích giúp lặp lại đệ quy trên tất cả các cây con bên dưới nó (con cái, con cái của họ, v.v.). Ví dụ:
>>> root[0][1].text
'2008'
6:

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}

>>> root[0][1].text
'2008'
7 chỉ tìm thấy các yếu tố có thẻ là trẻ em trực tiếp của yếu tố hiện tại.
>>> root[0][1].text
'2008'
8 Tìm đứa con đầu tiên có thẻ cụ thể và
>>> root[0][1].text
'2008'
9 truy cập vào nội dung văn bản phần tử.
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
0 truy cập vào các thuộc tính của phần tử:

>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68

Đặc điểm kỹ thuật tinh vi hơn về các yếu tố cần tìm là có thể bằng cách sử dụng XPath.XPath.

Sửa đổi tệp XML

>>> root.tag
'data'
>>> root.attrib
{}
7 cung cấp một cách đơn giản để xây dựng các tài liệu XML và viết chúng vào các tệp. Phương pháp
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
2 phục vụ mục đích này.

Sau khi được tạo, một đối tượng

>>> root.tag
'data'
>>> root.attrib
{}
8 có thể được thao tác bằng cách thay đổi trực tiếp các trường của nó (chẳng hạn như
>>> root[0][1].text
'2008'
9), thêm và sửa đổi các thuộc tính (phương thức
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
5), cũng như thêm trẻ em mới (ví dụ với
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
6).

Hãy nói rằng chúng tôi muốn thêm một vào cấp bậc của mỗi quốc gia và thêm thuộc tính

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
7 vào phần tử cấp bậc:

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')

XML của chúng tôi bây giờ trông như thế này:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
0

Chúng ta có thể loại bỏ các phần tử bằng

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
8. Hãy nói rằng chúng tôi muốn loại bỏ tất cả các quốc gia với thứ hạng cao hơn 50:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
1

Lưu ý rằng sửa đổi đồng thời trong khi lặp lại có thể dẫn đến các vấn đề, giống như khi lặp lại và sửa đổi danh sách python hoặc dicts. Do đó, ví dụ đầu tiên thu thập tất cả các yếu tố phù hợp với

>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
9 và chỉ sau đó lặp lại trong danh sách các trận đấu.

XML của chúng tôi bây giờ trông như thế này:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
2

Xây dựng tài liệu XML

Hàm

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
0 cũng cung cấp một cách thuận tiện để tạo các phần tử phụ mới cho một phần tử đã cho:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
3

Phân tích cú pháp XML với không gian tên

Nếu đầu vào XML có không gian tên, thẻ và thuộc tính có tiền tố ở dạng

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
1 sẽ được mở rộng thành
>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
2 trong đó tiền tố được thay thế bằng URI đầy đủ. Ngoài ra, nếu có một không gian tên mặc định, rằng URI đầy đủ đó sẽ được chuẩn bị cho tất cả các thẻ không có lỗi.

Dưới đây là một ví dụ XML kết hợp hai không gian tên, một với tiền tố hư cấu và cái còn lại là không gian tên mặc định:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
4

Một cách để tìm kiếm và khám phá ví dụ XML này là thêm thủ công URI vào mọi thẻ hoặc thuộc tính trong XPath của

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
3 hoặc
>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
4:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
5

Một cách tốt hơn để tìm kiếm ví dụ XML theo tên là tạo một từ điển với các tiền tố của riêng bạn và sử dụng chúng trong các chức năng tìm kiếm:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
6

Hai cách tiếp cận này cả hai đầu ra:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
7

Hỗ trợ Xpath¶

Mô -đun này cung cấp hỗ trợ hạn chế cho các biểu thức XPath để định vị các phần tử trong cây. Mục tiêu là hỗ trợ một tập hợp con nhỏ của cú pháp viết tắt; Một động cơ XPath đầy đủ nằm ngoài phạm vi của mô -đun.

Thí dụ¶

Ở đây, một ví dụ chứng minh một số khả năng XPath của mô -đun. Chúng tôi sẽ sử dụng tài liệu

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
5 XML từ phần phân tích cú pháp XML:Parsing XML section:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
8

Đối với XML có không gian tên, hãy sử dụng ký hiệu

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
6 đủ điều kiện thông thường:

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
9

Hỗ trợ Xpath Cú pháp

Cú pháp

Nghĩa

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
7

Chọn tất cả các phần tử con với thẻ đã cho. Ví dụ:

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
8 chọn tất cả các yếu tố con có tên
>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
8 và
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
0 chọn tất cả các cháu có tên
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
1 ở tất cả trẻ em có tên
>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
8.
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
3 Chọn tất cả các thẻ trong không gian tên đã cho,
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
4 chọn các thẻ có tên
>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
8 trong bất kỳ (hoặc không) không gian tên và
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
6 chỉ chọn các thẻ không có trong không gian tên.

Thay đổi trong phiên bản 3.8: Hỗ trợ cho Star-Wildcards đã được thêm vào.Support for star-wildcards was added.

>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
7

Chọn tất cả các yếu tố trẻ em, bao gồm cả ý kiến ​​và hướng dẫn xử lý. Ví dụ,

>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
8 chọn tất cả các cháu có tên
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
1.

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
0

Chọn nút hiện tại. Điều này chủ yếu là hữu ích ở đầu đường dẫn, để chỉ ra rằng nó là một con đường tương đối.

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
1

Chọn tất cả các phần mềm, trên tất cả các cấp bên dưới phần tử hiện tại. Ví dụ,

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
2 chọn tất cả các phần tử
>>> for country in root.findall('country'):
...     rank = country.find('rank').text
...     name = country.get('name')
...     print(name, rank)
...
Liechtenstein 1
Singapore 4
Panama 68
1 trong toàn bộ cây.

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
4

Chọn phần tử cha. Trả về

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 Nếu đường dẫn cố gắng tiếp cận tổ tiên của phần tử bắt đầu (phần tử
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
6 đã được gọi).

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
7

Chọn tất cả các yếu tố có thuộc tính đã cho.

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
8

Chọn tất cả các yếu tố mà thuộc tính đã cho có giá trị đã cho. Giá trị không thể chứa trích dẫn.

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
9

Chọn tất cả các yếu tố mà thuộc tính đã cho không có giá trị đã cho. Giá trị không thể chứa trích dẫn.

Mới trong phiên bản 3.10.

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
00

Chọn tất cả các yếu tố có một đứa trẻ tên

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
7. Chỉ có trẻ em ngay lập tức được hỗ trợ.

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
02

Chọn tất cả các yếu tố có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, bằng với

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
03 đã cho.

Mới trong phiên bản 3.7.

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
04

Chọn tất cả các yếu tố có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, không bằng

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
03 đã cho.

Mới trong phiên bản 3.10.

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
06

Chọn tất cả các yếu tố có một đứa trẻ tên

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
7. Chỉ có trẻ em ngay lập tức được hỗ trợ.

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
09

Chọn tất cả các yếu tố có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, bằng với

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
03 đã cho.

Mới trong phiên bản 3.10.

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
12

Chọn tất cả các yếu tố có một đứa trẻ tên

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
7. Chỉ có trẻ em ngay lập tức được hỗ trợ.

Chọn tất cả các yếu tố có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, bằng với

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
03 đã cho.

Mới trong phiên bản 3.7.

Chọn tất cả các yếu tố có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, không bằng import xml.etree.ElementTree as ET tree = ET.parse('country_data.xml') root = tree.getroot() 03 đã cho.

Chọn tất cả các yếu tố có một đứa trẻ tên
>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
7 có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, bằng với
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
03 đã cho.
canonicalize(xml_data=None, *, out=None, from_file=None, **options)

Chọn tất cả các yếu tố có một đứa trẻ tên

>>> for neighbor in root.iter('neighbor'):
...     print(neighbor.attrib)
...
{'name': 'Austria', 'direction': 'E'}
{'name': 'Switzerland', 'direction': 'W'}
{'name': 'Malaysia', 'direction': 'N'}
{'name': 'Costa Rica', 'direction': 'W'}
{'name': 'Colombia', 'direction': 'E'}
7 có nội dung văn bản hoàn chỉnh, bao gồm cả hậu duệ, không bằng
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
03 đã cho.

Chọn tất cả các yếu tố được đặt tại vị trí đã cho. Vị trí có thể là một số nguyên (1 là vị trí đầu tiên), biểu thức

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
13 (cho vị trí cuối cùng) hoặc một vị trí so với vị trí cuối cùng (ví dụ:
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
14).

Hàm này lấy chuỗi dữ liệu XML (xml_data) hoặc đường dẫn tệp hoặc đối tượng giống như tệp (từ_file) làm đầu vào, chuyển đổi nó thành dạng chính tắc và viết nó ra bằng đối tượng tệp (giống như), nếu được cung cấp hoặc Trả về nó dưới dạng chuỗi văn bản nếu không. Tệp đầu ra nhận văn bản, không phải byte. Do đó, nó nên được mở trong chế độ văn bản với mã hóa

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
16.

Sử dụng điển hình:

root = ET.fromstring(country_data_as_string)
0

Các tùy chọn cấu hình như sau:

  • with_comments: được đặt thành true để bao gồm các nhận xét (mặc định: false)

  • Strip_Text: Đặt thành True thành Dải khoảng trắng trước và sau khi nội dung văn bản

    (Mặc định: Sai)

  • viết lại_prefixes: Đặt thành TRUE để thay thế các tiền tố không gian tên bằng cách N {number},

    (Mặc định: Sai)

  • viết lại_prefixes: Đặt thành TRUE để thay thế các tiền tố không gian tên bằng cách N {number},

    qname_aware_tags: một tập hợp các tên thẻ nhận biết qName trong đó tiền tố

  • nên được thay thế trong nội dung văn bản (mặc định: trống)

    qname_aware_tags: một tập hợp các tên thẻ nhận biết qName trong đó tiền tố

  • nên được thay thế trong nội dung văn bản (mặc định: trống)

  • Qname_Aware_attrs: Một tập hợp các tên thuộc tính Aware Qname trong đó các tiền tố

loại trừ_attrs: một tập hợp các tên thuộc tính không nên tuần tự hóa

exclude_tags: một tập hợp các tên thẻ không nên tuần tự hóa

Trong danh sách tùy chọn ở trên, một bộ một bộ khác đề cập đến bất kỳ bộ sưu tập hoặc không thể điều chỉnh được, không có sự đặt hàng nào được mong đợi.

Mới trong phiên bản 3.8.

Bình luận Nhà máy yếu tố. Chức năng nhà máy này tạo ra một yếu tố đặc biệt sẽ được tuần tự hóa dưới dạng bình luận XML của bộ tuần tự tiêu chuẩn. Chuỗi nhận xét có thể là một chuỗi bytestring hoặc một chuỗi unicode. Văn bản là một chuỗi chứa chuỗi nhận xét. Trả về một thể hiện yếu tố đại diện cho một bình luận.dump(elem)

Lưu ý rằng

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 bỏ qua các bình luận trong đầu vào thay vì tạo các đối tượng bình luận cho chúng. Một
>>> root.tag
'data'
>>> root.attrib
{}
7 sẽ chỉ chứa các nút bình luận nếu chúng được đưa vào cây bằng một trong các phương thức
>>> root.tag
'data'
>>> root.attrib
{}
8.

xml.etree.elementtree.dump (elem) ¶

Viết một cây phần tử hoặc cấu trúc phần tử vào sys.stdout. Chức năng này chỉ nên được sử dụng để gỡ lỗi.

Định dạng đầu ra chính xác là phụ thuộc thực hiện. Trong phiên bản này, nó được viết dưới dạng tệp XML thông thường.The

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
20 function now preserves the attribute order specified by the user.

Elem là một cây phần tử hoặc một phần tử riêng lẻ.fromstring(text, parser=None)

Đã thay đổi trong phiên bản 3.8: Hàm

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
20 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.

xml.etree.elementtree.fromString (văn bản, trình phân tích cú pháp = không) ¶fromstringlist(sequence, parser=None)

Phân tích phần XML từ hằng số chuỗi. Giống như

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
21. Văn bản là một chuỗi chứa dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 tiêu chuẩn được sử dụng. Trả về một ví dụ
>>> root.tag
'data'
>>> root.attrib
{}
8.

xml.etree.elementtree.fromStringList (trình tự, trình phân tích cú pháp = none) ¶

Phân tích một tài liệu XML từ một chuỗi các đoạn chuỗi. Trình tự là một danh sách hoặc chuỗi khác chứa các đoạn dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 tiêu chuẩn được sử dụng. Trả về một ví dụ
>>> root.tag
'data'
>>> root.attrib
{}
8.
indent(tree, space='  ', level=0)

Mới trong phiên bản 3.2.

xml.etree.elementtree.indent (cây, space = '& nbsp;', level = 0) ¶

Lối nhiều khoảng trắng vào cây con để thụt vào cây một cách trực quan. Điều này có thể được sử dụng để tạo ra đầu ra XML được in khá đẹp. cây có thể là một yếu tố hoặc phần tử. Không gian là chuỗi khoảng trắng sẽ được chèn cho từng cấp độ thụt, hai ký tự không gian theo mặc định. Để thụt lề một phần bên trong của một cây đã thụt vào, vượt qua mức thụt đầu tiên dưới dạng cấp độ.iselement(element)

Mới trong phiên bản 3.9.

xml.etree.elementtree.iselement (phần tử) ¶iterparse(source, events=None, parser=None)

Kiểm tra xem một đối tượng dường như là một đối tượng phần tử hợp lệ. Phần tử là một thể hiện yếu tố. Trả về

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
26 Nếu đây là một đối tượng phần tử.file object containing XML data. events is a sequence of events to report back. The supported events are the strings
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
27,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
28,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
29,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
30,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
31 and
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
32 (the “ns” events are used to get detailed namespace information). If events is omitted, only
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
28 events are reported. parser is an optional parser instance. If not given, the standard
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 parser is used. parser must be a subclass of
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 and can only use the default
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 as a target. Returns an iterator providing
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
37 pairs.

xml.etree.elementtree.iterparse (Nguồn, sự kiện = Không, trình phân tích cú pháp = Không) ¶

Phân tích phần XML vào một cây phần tử tăng dần và báo cáo những gì mà người dùng sẽ tiếp tục. Nguồn là tên tệp hoặc đối tượng tệp chứa dữ liệu XML. Các sự kiện là một chuỗi các sự kiện để báo cáo lại. Các sự kiện được hỗ trợ là các chuỗi

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
27,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
28,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
29,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
30,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
31 và
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
32 (các sự kiện của NS NS được sử dụng để có thông tin không gian tên chi tiết). Nếu các sự kiện bị bỏ qua, chỉ có các sự kiện
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
28 được báo cáo. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 tiêu chuẩn được sử dụng. Trình phân tích cú pháp phải là một lớp con của
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 và chỉ có thể sử dụng
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 mặc định làm mục tiêu. Trả về một trình lặp cung cấp các cặp
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
37.

Lưu ý rằng trong khi

>>> root[0][1].text
'2008'
4 xây dựng cây dần dần, nó có sự cố chặn đọc trên nguồn (hoặc tên tệp nó). Do đó, nó không phù hợp với các ứng dụng trong đó việc chặn các lần đọc có thể được thực hiện. Để phân tích hoàn toàn không chặn, xem
>>> root[0][1].text
'2008'
0.

Nếu bạn cần một yếu tố điền kinh hoàn toàn, thay vào đó, hãy tìm các sự kiện về kết thúc.

Không dùng nữa kể từ phiên bản 3.4: Đối số phân tích cú pháp.The parser argument.

Thay đổi trong phiên bản 3.8: Các sự kiện

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
41 và
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
42 đã được thêm vào.The
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
41 and
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
42 events were added.

xml.etree.elementtree.parse (nguồn, trình phân tích cú pháp = không) ¶parse(source, parser=None)

Phân tích phần XML vào một cây phần tử. Nguồn là tên tệp hoặc đối tượng tệp chứa dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 tiêu chuẩn được sử dụng. Trả về một ví dụ
>>> root.tag
'data'
>>> root.attrib
{}
7.

xml.etree.elementtree.processingInstration (Target, text = none) ¶ProcessingInstruction(target, text=None)

Nhà máy nguyên tố PI. Chức năng nhà máy này tạo ra một yếu tố đặc biệt sẽ được tuần tự hóa dưới dạng hướng dẫn xử lý XML. Mục tiêu là một chuỗi chứa mục tiêu PI. Văn bản là một chuỗi chứa nội dung PI, nếu được đưa ra. Trả về một thể hiện phần tử, đại diện cho một lệnh xử lý.

Lưu ý rằng

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 bỏ qua các hướng dẫn xử lý trong đầu vào thay vì tạo các đối tượng nhận xét cho chúng. Một
>>> root.tag
'data'
>>> root.attrib
{}
7 sẽ chỉ chứa các nút lệnh xử lý nếu chúng được đưa vào cây bằng một trong các phương thức
>>> root.tag
'data'
>>> root.attrib
{}
8.

xml.etree.elementtree.register_namespace (tiền tố, uri) ¶register_namespace(prefix, uri)

Đăng ký một tiền tố không gian tên. Cơ quan đăng ký là toàn cầu và bất kỳ ánh xạ hiện có nào cho tiền tố đã cho hoặc URI không gian tên sẽ bị xóa. Tiền tố là tiền tố không gian tên. URI là một không gian tên Uri. Các thẻ và các thuộc tính trong không gian tên này sẽ được tuần tự hóa với tiền tố đã cho, nếu có thể.

Mới trong phiên bản 3.2.

xml.etree.elementtree.subelement (cha mẹ, tag, attribe = {}, ** thêm) ¶SubElement(parent, tag, attrib={}, **extra)

Nhà máy Subelement. Hàm này tạo ra một thể hiện phần tử và nối nó vào một phần tử hiện có.

Tên phần tử, tên thuộc tính và giá trị thuộc tính có thể là chuỗi bytestrings hoặc unicode. Cha mẹ là yếu tố cha mẹ. Tag là tên subelement. Attrible là một từ điển tùy chọn, chứa các thuộc tính phần tử. Thêm chứa các thuộc tính bổ sung, được đưa ra dưới dạng đối số từ khóa. Trả về một thể hiện phần tử.

xml.etree.elementtree.tostring (phần tử, mã hóa = 'us-ascii', meather = 'xml', *, xml_declaration = nonetostring(element, encoding='us-ascii', method='xml', *, xml_declaration=None, default_namespace=None, short_empty_elements=True)

Tạo một biểu diễn chuỗi của một phần tử XML, bao gồm tất cả các phần mềm. Phần tử là một ví dụ

>>> root.tag
'data'
>>> root.attrib
{}
8. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). Sử dụng
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
49 để tạo chuỗi unicode (nếu không, một bytestring được tạo). Phương thức là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
51 hoặc
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
52 (mặc định là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50). xml_declaration, default_namespace và short_empty_elements có cùng ý nghĩa như trong
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
2. Trả về một chuỗi được mã hóa (tùy chọn) chứa dữ liệu XML.

Mới trong phiên bản 3.4: Tham số Short_empty_elements.The short_empty_elements parameter.

Mới trong phiên bản 3.8: Các tham số XML_Declaration và Default_namespace.The xml_declaration and default_namespace parameters.

Đã thay đổi trong phiên bản 3.8: Hàm

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
55 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.The
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
55 function now preserves the attribute order specified by the user.

xml.etree.elementtree.tostringlist (phần tử, mã hóa = 'us-ascii', meather = 'xml', *, xml_declaration = nonetostringlist(element, encoding='us-ascii', method='xml', *, xml_declaration=None, default_namespace=None, short_empty_elements=True)

Tạo một biểu diễn chuỗi của một phần tử XML, bao gồm tất cả các phần mềm. Phần tử là một ví dụ

>>> root.tag
'data'
>>> root.attrib
{}
8. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). Sử dụng
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
49 để tạo chuỗi unicode (nếu không, một bytestring được tạo). Phương thức là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
51 hoặc
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
52 (mặc định là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50). xml_declaration, default_namespace và short_empty_elements có cùng ý nghĩa như trong
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
2. Trả về một danh sách các chuỗi được mã hóa (tùy chọn) chứa dữ liệu XML. Nó không đảm bảo bất kỳ chuỗi cụ thể nào, ngoại trừ
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
63.

Mới trong phiên bản 3.2.

Mới trong phiên bản 3.4: Tham số Short_empty_elements.The short_empty_elements parameter.

Mới trong phiên bản 3.8: Các tham số XML_Declaration và Default_namespace.The xml_declaration and default_namespace parameters.

Đã thay đổi trong phiên bản 3.8: Hàm

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
55 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.The
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
64 function now preserves the attribute order specified by the user.

xml.etree.elementtree.tostringlist (phần tử, mã hóa = 'us-ascii', meather = 'xml', *, xml_declaration = noneXML(text, parser=None)

Tạo một biểu diễn chuỗi của một phần tử XML, bao gồm tất cả các phần mềm. Phần tử là một ví dụ

>>> root.tag
'data'
>>> root.attrib
{}
8. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). Sử dụng
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
49 để tạo chuỗi unicode (nếu không, một bytestring được tạo). Phương thức là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
51 hoặc
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
52 (mặc định là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50). xml_declaration, default_namespace và short_empty_elements có cùng ý nghĩa như trong
>>> parser = ET.XMLPullParser(['start', 'end'])
>>> parser.feed('sometext')
>>> list(parser.read_events())
[('start', )]
>>> parser.feed(' more text')
>>> for event, elem in parser.read_events():
...     print(event)
...     print(elem.tag, 'text=', elem.text)
...
end
2. Trả về một danh sách các chuỗi được mã hóa (tùy chọn) chứa dữ liệu XML. Nó không đảm bảo bất kỳ chuỗi cụ thể nào, ngoại trừ
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
63.

Đã thay đổi trong phiên bản 3.8: Hàm
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
64 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.
XMLID(text, parser=None)

xml.etree.elementtree.xml (văn bản, trình phân tích cú pháp = không) ¶

Phân tích phần XML từ hằng số chuỗi. Chức năng này có thể được sử dụng để nhúng các loại văn bản XML XML trong mã Python. Văn bản là một chuỗi chứa dữ liệu XML. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp >>> for child in root: ... print(child.tag, child.attrib) ... country {'name': 'Liechtenstein'} country {'name': 'Singapore'} country {'name': 'Panama'} 7 tiêu chuẩn được sử dụng. Trả về một ví dụ >>> root.tag 'data' >>> root.attrib {} 8.

Mô -đun này cung cấp hỗ trợ hạn chế cho các chỉ thị xinclude, thông qua mô -đun trợ giúp

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
69. Mô -đun này có thể được sử dụng để chèn các cây con và chuỗi văn bản vào các cây phần tử, dựa trên thông tin trong cây.

Thí dụ¶

Ở đây, một ví dụ chứng minh việc sử dụng mô -đun xinclude. Để bao gồm một tài liệu XML trong tài liệu hiện tại, hãy sử dụng phần tử

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
70 và đặt thuộc tính phân tích cú pháp thành
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50 và sử dụng thuộc tính HREF để chỉ định tài liệu để bao gồm.parse attribute to
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50, and use the href attribute to specify the document to include.

root = ET.fromstring(country_data_as_string)
1

Theo mặc định, thuộc tính HREF được coi là tên tệp. Bạn có thể sử dụng trình tải tùy chỉnh để ghi đè hành vi này. Cũng lưu ý rằng người trợ giúp tiêu chuẩn không hỗ trợ cú pháp XPOUNIN.href attribute is treated as a file name. You can use custom loaders to override this behaviour. Also note that the standard helper does not support XPointer syntax.

Để xử lý tệp này, hãy tải nó như bình thường và chuyển phần tử gốc đến mô -đun

>>> root.tag
'data'
>>> root.attrib
{}
2:

root = ET.fromstring(country_data_as_string)
2

Mô -đun ElementInClude thay thế phần tử

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
70 bằng phần tử gốc từ tài liệu Source.xml. Kết quả có thể trông giống như thế này:source.xml document. The result might look something like this:

root = ET.fromstring(country_data_as_string)
3

Nếu thuộc tính phân tích cú pháp bị bỏ qua, nó mặc định là XML XML. Thuộc tính HREF là bắt buộc.parse attribute is omitted, it defaults to “xml”. The href attribute is required.

Để bao gồm một tài liệu văn bản, hãy sử dụng phần tử

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
70 và đặt thuộc tính phân tích cú pháp thành văn bản trực tuyến:parse attribute to “text”:

root = ET.fromstring(country_data_as_string)
4

Kết quả có thể trông giống như:

root = ET.fromstring(country_data_as_string)
5

Tài liệu tham khảo¶

Chức năng¶

xml.etree.elementinclude.default_loader (href, parse, mã hóa = none) ¶default_loader(href, parse, encoding=None)

Trình tải mặc định. Trình tải mặc định này đọc một tài nguyên bao gồm từ đĩa. href là một url. Parse là cho chế độ phân tích cú pháp hoặc là XML, hoặc văn bản. Mã hóa là một mã hóa văn bản tùy chọn. Nếu không được đưa ra, mã hóa là

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
16. Trả về tài nguyên mở rộng. Nếu chế độ phân tích phân tích là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50, đây là một thể hiện ElementTree. Nếu chế độ phân tích cú pháp là văn bản, thì đây là một chuỗi unicode. Nếu trình tải không thành công, nó có thể trả về không hoặc tăng ngoại lệ.

xml.etree.elementinclude.include (elem, loader = none, base_url = none, max_depth = 6) ¶include(elem, loader=None, base_url=None, max_depth=6)

Hàm này mở rộng chỉ thị Xinclude. Elem là yếu tố gốc. Trình tải là một trình tải tài nguyên tùy chọn. Nếu bị bỏ qua, nó mặc định là

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
77. Nếu được đưa ra, nó phải là một cuộc gọi có thể thực hiện cùng giao diện với
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
77. Base_URL là URL cơ sở của tệp gốc, để giải quyết tương đối bao gồm các tham chiếu tệp. MAX_DEPTH là số lượng vùi đệ quy tối đa. Giới hạn để giảm nguy cơ nổ nội dung độc hại. Vượt qua một giá trị âm để vô hiệu hóa giới hạn.

Trả về tài nguyên mở rộng. Nếu chế độ phân tích phân tích là

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50, đây là một thể hiện ElementTree. Nếu chế độ phân tích cú pháp là văn bản, thì đây là một chuỗi unicode. Nếu trình tải không thành công, nó có thể trả về không hoặc tăng ngoại lệ.

Mới trong phiên bản 3.9: Các tham số Base_URL và MAX_DEPTH.The base_url and max_depth parameters.

Đối tượng phần tử

classxml.etree.elementtree.element (tag, attribe = {}, ** thêm) ¶ xml.etree.ElementTree.Element(tag, attrib={}, **extra)

Lớp phần tử. Lớp này xác định giao diện phần tử và cung cấp triển khai tham chiếu của giao diện này.

Tên phần tử, tên thuộc tính và giá trị thuộc tính có thể là chuỗi bytestrings hoặc unicode. Tag là tên phần tử. Attrible là một từ điển tùy chọn, chứa các thuộc tính phần tử. Thêm chứa các thuộc tính bổ sung, được đưa ra dưới dạng đối số từ khóa.

nhãn¶

Một chuỗi xác định loại dữ liệu mà phần tử này biểu diễn (loại phần tử, nói cách khác).

Text¶ Tail¶tail

Các thuộc tính này có thể được sử dụng để chứa dữ liệu bổ sung được liên kết với phần tử. Giá trị của chúng thường là chuỗi nhưng có thể là bất kỳ đối tượng dành riêng cho ứng dụng. Nếu phần tử được tạo từ tệp XML, thuộc tính văn bản sẽ giữ văn bản giữa thẻ bắt đầu của phần tử và thẻ con đầu tiên hoặc đầu , hoặc

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5. Đối với dữ liệu XML

root = ET.fromstring(country_data_as_string)
6

Phần tử A có

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 cho cả thuộc tính văn bản và đuôi, phần tử B có văn bản
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
83 và đuôi
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
84, phần tử C có văn bản
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
85 và đuôi
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5, và phần tử D có văn bản
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 và đuôi
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
88.

Để thu thập văn bản bên trong của một phần tử, xem

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
89, ví dụ
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
90.

Các ứng dụng có thể lưu trữ các đối tượng tùy ý trong các thuộc tính này.

thuộc về thuộc về

Một từ điển chứa các thuộc tính của phần tử. Lưu ý rằng trong khi giá trị thuộc tính luôn là một từ điển Python có thể thay đổi thực sự, nhưng việc triển khai ElementTree có thể chọn sử dụng một biểu diễn nội bộ khác và chỉ tạo từ điển nếu ai đó yêu cầu nó. Để tận dụng các triển khai như vậy, hãy sử dụng các phương thức từ điển dưới đây bất cứ khi nào có thể.

Các phương thức giống như từ điển hoạt động trên các thuộc tính phần tử.

xa lạ()¶()

Đặt lại một yếu tố. Hàm này loại bỏ tất cả các phần mềm, xóa tất cả các thuộc tính và đặt các thuộc tính văn bản và đuôi thành

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5.

Nhận (khóa, mặc định = Không) ¶(key, default=None)

Nhận thuộc tính phần tử có tên là khóa.

Trả về giá trị thuộc tính hoặc mặc định nếu không tìm thấy thuộc tính.

mặt hàng()¶()

Trả về các thuộc tính phần tử như một chuỗi của các cặp (tên, giá trị). Các thuộc tính được trả về theo thứ tự tùy ý.

chìa khóa () ¶()

Trả về tên thuộc tính phần tử làm danh sách. Các tên được trả lại theo thứ tự tùy ý.

Đặt (khóa, giá trị)(key, value)

Đặt phím thuộc tính trên phần tử thành giá trị.

Các phương pháp sau đây hoạt động trên các yếu tố trẻ em (phụ).

ốp sắt (subelement) ¶(subelement)

Thêm phần tử SubSement vào cuối danh sách nội bộ của phần tử này. Tăng

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
92 nếu Subelement không phải là
>>> root.tag
'data'
>>> root.attrib
{}
8.

Mở rộng (SubErements) ¶(subelements)

Nối các phần mềm từ một đối tượng chuỗi bằng 0 hoặc nhiều phần tử. Tăng

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
92 nếu một Subelement không phải là
>>> root.tag
'data'
>>> root.attrib
{}
8.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶(match, namespaces=None)

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns an element instance or
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5. namespaces is an optional mapping from namespace prefix to full name. Pass
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 as prefix to move all unprefixed tag names in the expression into the given namespace.

Findall (khớp, không gian tên = không) ¶(match, namespaces=None)

Tìm tất cả các phần mềm phù hợp, theo tên thẻ hoặc đường dẫn. Trả về một danh sách chứa tất cả các yếu tố phù hợp theo thứ tự tài liệu. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns a list containing all matching elements in document order. namespaces is an optional mapping from namespace prefix to full name. Pass
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 as prefix to move all unprefixed tag names in the expression into the given namespace.

FindText (khớp, mặc định = không, không gian tên = none) ¶(match, default=None, namespaces=None)

Tìm văn bản cho trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về nội dung văn bản của phần tử khớp đầu tiên hoặc mặc định nếu không tìm thấy phần tử nào. Lưu ý rằng nếu phần tử phù hợp không có nội dung văn bản, một chuỗi trống được trả về. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns the text content of the first matching element, or default if no element was found. Note that if the matching element has no text content an empty string is returned. namespaces is an optional mapping from namespace prefix to full name. Pass
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 as prefix to move all unprefixed tag names in the expression into the given namespace.

Chèn (INDEX, SUPEuity) ¶(index, subelement)

Chèn SubLement tại vị trí đã cho trong yếu tố này. Tăng

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
92 nếu Subelement không phải là
>>> root.tag
'data'
>>> root.attrib
{}
8.

iter (tag = none) ¶(tag=None)

Tạo một bộ lặp cây với phần tử hiện tại là gốc. Trình lặp lặp lại trên phần tử này và tất cả các phần tử bên dưới nó, theo thứ tự tài liệu (độ sâu đầu tiên). Nếu thẻ không phải là

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 hoặc
root = ET.fromstring(country_data_as_string)
03, chỉ các thành phần có thẻ bằng thẻ được trả về từ trình lặp. Nếu cấu trúc cây được sửa đổi trong quá trình lặp, kết quả không được xác định.iterator with the current element as the root. The iterator iterates over this element and all elements below it, in document (depth first) order. If tag is not
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 or
root = ET.fromstring(country_data_as_string)
03, only elements whose tag equals tag are returned from the iterator. If the tree structure is modified during iteration, the result is undefined.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶(match, namespaces=None)

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.path. Returns an iterable yielding all matching elements in document order. namespaces is an optional mapping from namespace prefix to full name.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶()

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

Mới trong phiên bản 3.2.

Tìm (khớp, không gian tên = Không) ¶(tag, attrib)

Tìm các trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về một thể hiện phần tử hoặc

>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

Findall (khớp, không gian tên = không) ¶(subelement)

Tìm tất cả các phần mềm phù hợp, theo tên thẻ hoặc đường dẫn. Trả về một danh sách chứa tất cả các yếu tố phù hợp theo thứ tự tài liệu. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

FindText (khớp, mặc định = không, không gian tên = none) ¶

Tìm văn bản cho trận đấu phù hợp đầu tiên của Subelement. khớp có thể là một tên thẻ hoặc một đường dẫn. Trả về nội dung văn bản của phần tử khớp đầu tiên hoặc mặc định nếu không tìm thấy phần tử nào. Lưu ý rằng nếu phần tử phù hợp không có nội dung văn bản, một chuỗi trống được trả về. Không gian tên là một ánh xạ tùy chọn từ tiền tố không gian tên đến tên đầy đủ. Vượt qua

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 làm tiền tố để di chuyển tất cả các tên thẻ chưa được phân chia trong biểu thức vào không gian tên đã cho.

root = ET.fromstring(country_data_as_string)
7

Chèn (INDEX, SUPEuity) ¶

Chèn SubLement tại vị trí đã cho trong yếu tố này. Tăng

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
92 nếu Subelement không phải là
>>> root.tag
'data'
>>> root.attrib
{}
8.

iter (tag = none) ¶

root = ET.fromstring(country_data_as_string)
8

Đối tượng ElementTree

classxml.etree.elementtree.elementtree (phần tử = none, file = none) ¶ xml.etree.ElementTree.ElementTree(element=None, file=None)

Lớp trình bao bọc ElementTree. Lớp này đại diện cho toàn bộ hệ thống phân cấp phần tử và thêm một số hỗ trợ bổ sung cho việc tuần tự hóa đến và từ XML tiêu chuẩn.

Phần tử là phần tử gốc. Cây được khởi tạo với nội dung của tệp XML nếu được đưa ra.

_setroot (phần tử) ¶(element)

Thay thế phần tử gốc cho cây này. Điều này loại bỏ các nội dung hiện tại của cây và thay thế nó bằng phần tử đã cho. Sử dụng một cách cẩn thận. Phần tử là một thể hiện yếu tố.

Tìm (khớp, không gian tên = Không) ¶(match, namespaces=None)

Giống như

>>> root[0][1].text
'2008'
8, bắt đầu từ gốc của cây.

Findall (khớp, không gian tên = không) ¶(match, namespaces=None)

Giống như

>>> root[0][1].text
'2008'
7, bắt đầu từ gốc của cây.

FindText (khớp, mặc định = không, không gian tên = none) ¶(match, default=None, namespaces=None)

Giống như

root = ET.fromstring(country_data_as_string)
16, bắt đầu từ gốc của cây.

getroot () ¶()

Trả về phần tử gốc cho cây này.

iter (tag = none) ¶(tag=None)

Tạo và trả về một bộ lặp cây cho phần tử gốc. Các vòng lặp lặp trên tất cả các yếu tố trong cây này, theo thứ tự phần. Tag là thẻ để tìm kiếm (mặc định là trả về tất cả các yếu tố).

iterfind (khớp, không gian tên = không) ¶(match, namespaces=None)

Giống như

root = ET.fromstring(country_data_as_string)
17, bắt đầu từ gốc của cây.

Mới trong phiên bản 3.2.

Parse (Nguồn, trình phân tích cú pháp = Không) ¶(source, parser=None)

Tải phần XML bên ngoài vào cây phần tử này. Nguồn là tên tệp hoặc đối tượng tệp. Trình phân tích cú pháp là một thể hiện trình phân tích cú pháp tùy chọn. Nếu không được đưa ra, trình phân tích cú pháp

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 tiêu chuẩn được sử dụng. Trả về phần phần tử gốc.file object. parser is an optional parser instance. If not given, the standard
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
7 parser is used. Returns the section root element.

Viết (Tệp, mã hóa = 'us-ascii', xml_declaration = none, default_namespace = none, meather = 'xml', *, short_empty_elements = true)(file, encoding='us-ascii', xml_declaration=None, default_namespace=None, method='xml', *, short_empty_elements=True)

Viết cây phần tử vào một tệp, như XML. Tệp là một tên tệp hoặc một đối tượng tệp được mở để viết. Mã hóa 1 là mã hóa đầu ra (mặc định là US-ASCII). XML_Declaration điều khiển nếu sẽ được thêm khai báo XML vào tệp. Sử dụng

root = ET.fromstring(country_data_as_string)
10 cho không bao giờ,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
26 luôn luôn,
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 chỉ nếu không phải là US-ASCII hoặc UTF-8 hoặc Unicode (mặc định là
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5). Default_namespace đặt không gian tên XML mặc định (đối với các loại XMLNS). Phương thức là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
51 hoặc
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
52 (mặc định là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50). Tham số chỉ từ khóa chỉ ngắn hạn_empty_elements kiểm soát định dạng của các phần tử không chứa nội dung. Nếu
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
26 (mặc định), chúng được phát ra dưới dạng một thẻ tự đóng, nếu không chúng được phát ra dưới dạng một cặp thẻ bắt đầu/kết thúc.file object opened for writing. encoding 1 is the output encoding (default is US-ASCII). xml_declaration controls if an XML declaration should be added to the file. Use
root = ET.fromstring(country_data_as_string)
10 for never,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
26 for always,
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5 for only if not US-ASCII or UTF-8 or Unicode (default is
>>> for rank in root.iter('rank'):
...     new_rank = int(rank.text) + 1
...     rank.text = str(new_rank)
...     rank.set('updated', 'yes')
...
>>> tree.write('output.xml')
5). default_namespace sets the default XML namespace (for “xmlns”). method is either
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50,
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
51 or
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
52 (default is
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
50). The keyword-only short_empty_elements parameter controls the formatting of elements that contain no content. If
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
26 (the default), they are emitted as a single self-closed tag, otherwise they are emitted as a pair of start/end tags.

Đầu ra là một chuỗi (

root = ET.fromstring(country_data_as_string)
28) hoặc nhị phân (
root = ET.fromstring(country_data_as_string)
29). Điều này được kiểm soát bởi đối số mã hóa. Nếu mã hóa là
root = ET.fromstring(country_data_as_string)
30, đầu ra là một chuỗi; Nếu không, nó nhị phân. Lưu ý rằng điều này có thể mâu thuẫn với loại tệp nếu nó là một đối tượng tệp mở; Hãy chắc chắn rằng bạn không cố gắng viết một chuỗi vào luồng nhị phân và ngược lại.file object; make sure you do not try to write a string to a binary stream and vice versa.

Mới trong phiên bản 3.4: Tham số Short_empty_elements.The short_empty_elements parameter.

Đã thay đổi trong phiên bản 3.8: Phương thức

root = ET.fromstring(country_data_as_string)
31 hiện bảo tồn thứ tự thuộc tính được chỉ định bởi người dùng.The
root = ET.fromstring(country_data_as_string)
31 method now preserves the attribute order specified by the user.

Đây là tệp XML sẽ bị thao túng:

root = ET.fromstring(country_data_as_string)
9

Ví dụ về việc thay đổi thuộc tính Target Target của mỗi liên kết trong đoạn đầu tiên:

>>> root.tag
'data'
>>> root.attrib
{}
0

Đối tượng Qname

classxml.etree.elementtree.qname (text_or_uri, tag = none) ¶ xml.etree.ElementTree.QName(text_or_uri, tag=None)

QNAME WRAPPER. Điều này có thể được sử dụng để bọc giá trị thuộc tính Qname, để có được xử lý không gian tên thích hợp trên đầu ra. Text_or_uri là một chuỗi chứa giá trị qname, ở dạng {uri} cục bộ, hoặc, nếu đối số thẻ được đưa ra, phần URI của Qname. Nếu TAG được đưa ra, đối số đầu tiên được hiểu là một URI và đối số này được hiểu là một tên địa phương.

root = ET.fromstring(country_data_as_string)
32 Các trường hợp mờ đục.

Đối tượng TreeBuilder

classxml.etree.elementtree.treeBuilder (Element_factory = none, *, bình luận_factory = none, pi_factory = none, insert_comments = false, insert_pis = false) xml.etree.ElementTree.TreeBuilder(element_factory=None, *, comment_factory=None, pi_factory=None, insert_comments=False, insert_pis=False)

Trình tạo cấu trúc phần tử chung. Nhà xây dựng này chuyển đổi một chuỗi bắt đầu, dữ liệu, kết thúc, nhận xét và phương thức PI gọi đến một cấu trúc phần tử được hình thành tốt. Bạn có thể sử dụng lớp này để xây dựng cấu trúc phần tử bằng trình phân tích cú pháp XML tùy chỉnh hoặc trình phân tích cú pháp cho một số định dạng giống như XML khác.

Element_Factory, khi được đưa ra, phải là một người có thể gọi là có thể chấp nhận hai đối số vị trí: một thẻ và một phương pháp của các thuộc tính. Dự kiến ​​sẽ trả về một thể hiện yếu tố mới.

Các chức năng bình luận_factory và pi_factory, khi được đưa ra, nên hoạt động như các chức năng

root = ET.fromstring(country_data_as_string)
33 và
root = ET.fromstring(country_data_as_string)
34 để tạo nhận xét và hướng dẫn xử lý. Khi không được đưa ra, các nhà máy mặc định sẽ được sử dụng. Khi insert_comments và/hoặc insert_pis là đúng, nhận xét/pis sẽ được chèn vào cây nếu chúng xuất hiện trong phần tử gốc (nhưng không nằm ngoài nó).

gần()¶()

Xóa các bộ đệm xây dựng và trả về yếu tố tài liệu Toplevel. Trả về một ví dụ

>>> root.tag
'data'
>>> root.attrib
{}
8.

Dữ liệu (dữ liệu) ¶(data)

Thêm văn bản vào phần tử hiện tại. Dữ liệu là một chuỗi. Điều này phải là một bytestring hoặc chuỗi unicode.

kết thúc (thẻ) ¶(tag)

Đóng phần tử hiện tại. Tag là tên phần tử. Trả về phần tử đóng.

Bắt đầu (Tag, attrs) ¶(tag, attrs)

Mở một yếu tố mới. Tag là tên phần tử. Attrs là một từ điển chứa các thuộc tính phần tử. Trả về phần tử đã mở.

Tạo một nhận xét với văn bản đã cho. Nếu

root = ET.fromstring(country_data_as_string)
36 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶(target, text)

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu

root = ET.fromstring(country_data_as_string)
37 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu
root = ET.fromstring(country_data_as_string)
37 là đúng, điều này cũng sẽ thêm nó vào cây.
(name, pubid, system)

Ngoài ra, một đối tượng

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 tùy chỉnh có thể cung cấp các phương thức sau:

doctype (tên, pubid, system) ¶

Xử lý một tuyên bố doctype. Tên là tên doctype. PubID là định danh công khai. Hệ thống là định danh hệ thống. Phương pháp này không tồn tại trên lớp
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 mặc định.
(prefix, uri)

Mới trong phiên bản 3.2.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶(prefix)

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu

root = ET.fromstring(country_data_as_string)
37 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶xml.etree.ElementTree.C14NWriterTarget(write, *, with_comments=False, strip_text=False, rewrite_prefixes=False, qname_aware_tags=None, qname_aware_attrs=None, exclude_attrs=None, exclude_tags=None)

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu

root = ET.fromstring(country_data_as_string)
37 là đúng, điều này cũng sẽ thêm nó vào cây.

Mới trong phiên bản 3.8.

pi (mục tiêu, văn bản) ¶

Tạo một nhận xét với tên và văn bản mục tiêu đã cho. Nếu
root = ET.fromstring(country_data_as_string)
37 là đúng, điều này cũng sẽ thêm nó vào cây.
xml.etree.ElementTree.XMLParser(*, target=None, encoding=None)

Ngoài ra, một đối tượng

>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 tùy chỉnh có thể cung cấp các phương thức sau:

doctype (tên, pubid, system) ¶Parameters are now keyword-only. The html argument no longer supported.

Xử lý một tuyên bố doctype. Tên là tên doctype. PubID là định danh công khai. Hệ thống là định danh hệ thống. Phương pháp này không tồn tại trên lớp
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 mặc định.
()

Mới trong phiên bản 3.2.

start_ns (tiền tố, uri) ¶(data)

Được gọi bất cứ khi nào trình phân tích cú pháp gặp phải một tuyên bố không gian tên mới, trước khi gọi lại

root = ET.fromstring(country_data_as_string)
40 cho phần tử mở xác định nó. Tiền tố là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 cho không gian tên mặc định và tên tiền tố không gian tên được khai báo khác. Uri là URI không gian tên.

end_ns (tiền tố) ¶

>>> root.tag
'data'
>>> root.attrib
{}
1

Được gọi sau khi gọi lại root = ET.fromstring(country_data_as_string) 42 của một phần tử đã khai báo ánh xạ tiền tố không gian tên, với tên của tiền tố đã đi ra khỏi phạm vi.

classxml.etree.elementtree.c14nwritertarget (write, *, with_comments = false xml.etree.ElementTree.XMLPullParser(events=None)

Một người viết C14N 2.0. Các đối số giống như đối với hàm

root = ET.fromstring(country_data_as_string)
13. Lớp này không xây dựng một cây nhưng dịch các sự kiện gọi lại trực tiếp thành một dạng tuần tự bằng cách sử dụng hàm ghi.

start_ns (tiền tố, uri) ¶(data)

Được gọi bất cứ khi nào trình phân tích cú pháp gặp phải một tuyên bố không gian tên mới, trước khi gọi lại

root = ET.fromstring(country_data_as_string)
40 cho phần tử mở xác định nó. Tiền tố là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 cho không gian tên mặc định và tên tiền tố không gian tên được khai báo khác. Uri là URI không gian tên.

Xử lý một tuyên bố doctype. Tên là tên doctype. PubID là định danh công khai. Hệ thống là định danh hệ thống. Phương pháp này không tồn tại trên lớp
>>> for child in root:
...     print(child.tag, child.attrib)
...
country {'name': 'Liechtenstein'}
country {'name': 'Singapore'}
country {'name': 'Panama'}
6 mặc định.
()

Mới trong phiên bản 3.2.

start_ns (tiền tố, uri) ¶()

Được gọi bất cứ khi nào trình phân tích cú pháp gặp phải một tuyên bố không gian tên mới, trước khi gọi lại

root = ET.fromstring(country_data_as_string)
40 cho phần tử mở xác định nó. Tiền tố là
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
97 cho không gian tên mặc định và tên tiền tố không gian tên được khai báo khác. Uri là URI không gian tên.

  • end_ns (tiền tố) ¶

  • Được gọi sau khi gọi lại

    root = ET.fromstring(country_data_as_string)
    
    42 của một phần tử đã khai báo ánh xạ tiền tố không gian tên, với tên của tiền tố đã đi ra khỏi phạm vi.

  • classxml.etree.elementtree.c14nwritertarget (write, *, with_comments = false

  • Một người viết C14N 2.0. Các đối số giống như đối với hàm

    root = ET.fromstring(country_data_as_string)
    
    13. Lớp này không xây dựng một cây nhưng dịch các sự kiện gọi lại trực tiếp thành một dạng tuần tự bằng cách sử dụng hàm ghi.

XMLPARSER Đối tượng

Ghi chú

>>> root[0][1].text
'2008'
0 chỉ đảm bảo rằng nó đã nhìn thấy ký tự>> của một thẻ bắt đầu khi nó phát ra sự kiện bắt đầu, vì vậy các thuộc tính được xác định, nhưng nội dung của các thuộc tính văn bản và đuôi không được xác định tại điểm đó. Điều tương tự áp dụng cho trẻ em yếu tố; Họ có thể hoặc không thể có mặt.

Nếu bạn cần một yếu tố điền kinh hoàn toàn, thay vào đó, hãy tìm các sự kiện về kết thúc.

Mới trong phiên bản 3.4.

Thay đổi trong phiên bản 3.8: Các sự kiện

import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
41 và
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
42 đã được thêm vào.The
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
41 and
import xml.etree.ElementTree as ET
tree = ET.parse('country_data.xml')
root = tree.getroot()
42 events were added.

Ngoại lệ ha

classxml.etree.elementtree.parseerror¶ xml.etree.ElementTree.ParseError

Lỗi phân tích cú pháp XML, được nâng lên bởi các phương pháp phân tích cú pháp khác nhau trong mô -đun này khi phân tích cú pháp bị lỗi. Biểu diễn chuỗi của một thể hiện của ngoại lệ này sẽ chứa thông báo lỗi thân thiện với người dùng. Ngoài ra, nó sẽ có sẵn các thuộc tính sau:

mã số¶

Một mã lỗi số từ trình phân tích cú pháp người nước ngoài. Xem tài liệu của

root = ET.fromstring(country_data_as_string)
44 để biết danh sách các mã lỗi và ý nghĩa của chúng.

Chức vụ¶

Một tuple của dòng, số cột, chỉ định nơi xảy ra lỗi.

Chú thích

1(1,2,3,4)(1,2,3,4)

Chuỗi mã hóa được bao gồm trong đầu ra XML phải phù hợp với các tiêu chuẩn thích hợp. Ví dụ, UTF-8 có hợp lệ, nhưng không phải là UTF8 thì thì không. Xem https://www.w3.org/tr/2006/rec-xml11-20060816/#nt-encodingdecl và https://www.iana.org/assignments/character-sets/character-sets.xhtml.

Làm thế nào tôi có thể phân tích XML?

XML DOM (mô hình đối tượng tài liệu) xác định các thuộc tính và phương thức để truy cập và chỉnh sửa XML. Tuy nhiên, trước khi có thể truy cập tài liệu XML, nó phải được tải vào đối tượng DOM XML. Tất cả các trình duyệt hiện đại có trình phân tích cú pháp XML tích hợp có thể chuyển đổi văn bản thành đối tượng XML DOM.All modern browsers have a built-in XML parser that can convert text into an XML DOM object.

Bạn có thể sử dụng mô -đun nào để phân tích tệp XML bằng Python?

Python cho phép phân tích các tài liệu XML này bằng hai mô -đun là mô -đun xml.etree.elementtree và minidom (triển khai DOM tối thiểu).xml. etree. ElementTree module and Minidom (Minimal DOM Implementation).

XML được sử dụng như thế nào trong Python?

Thư viện tiêu chuẩn Python cung cấp một bộ giao diện tối thiểu nhưng hữu ích để hoạt động với XML.Hai API cơ bản và được sử dụng rộng nhất cho dữ liệu XML là các giao diện Sax và DOM.API đơn giản cho XML (SAX) - Tại đây, bạn đăng ký các cuộc gọi lại cho các sự kiện quan tâm và sau đó để trình phân tích cú pháp tiến hành thông qua tài liệu.. The two most basic and broadly used APIs to XML data are the SAX and DOM interfaces. Simple API for XML (SAX) − Here, you register callbacks for events of interest and then let the parser proceed through the document.

Pandas có thể phân tích xml không?

Thư viện phân tích dữ liệu PANDAS cung cấp các chức năng để đọc/ghi dữ liệu cho hầu hết các loại tệp.Ví dụ: nó bao gồm read_csv () và to_csv () để tương tác với các tệp CSV.Tuy nhiên, Pandas không bao gồm bất kỳ phương pháp nào để đọc và ghi các tệp XML.Pandas does not include any methods to read and write XML files.