Python3 XML解析
发布时间:2025-10-22 21:26:04

Python3 XML解析
XML是什么?
XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集是用来标记电子文件使其具有结构性的标记语言。
XML 用于传输和存储数据的设计。
XML是一套定义语义标记的规则,它将文档分成许多部分并标记它们。
它也是元标记语言,即定义句法语言,用于定义其他与特定领域相关的语义和结构化标记语言。
Python对XML的分析
常用的XML编程接口有DOM和SAX,这两种接口处理XML文件的方式不同,当然使用场合也不同。
XML分析Python有三种方法,SAX,DOM,以及Elementreeee:
1.SAX (simple API for XML )
python 标准库包括SAX分析器,SAX通过在分析XML的过程中触发事件并调用用户定义的回调函数来处理XML文件。
2.DOM(Document Object Model)
将XML数据分析成内存中的一棵树,通过操作树来操作XML。
本章使用的XML实例文件moviess.xml内容如下:
<collectionshelf="NewArrivals"> <movietitle="EnemyBehind"> <type>War,Thriller</type> <format>DVD</format> <year>2003</year> <rating>PG</rating> <stars>10</stars> <description>TalkaboutaUS-Japanwar</description> </movie> <movietitle="Transformers"> <type>Anime,ScienceFiction</type> <format>DVD</format> <year>1989</year> <rating>R</rating> <stars>8</stars> <description>Aschientificfiction</description> </movie> <movietitle="Trigun"> <type>Anime,Action</type> <format>DVD</format> <episodes>4</episodes> <rating>PG</rating> <stars>10</stars> <description>VashtheStampede!</description> </movie> <movietitle="Ishtar"> <type>Comedy</type> <format>VHS</format> <rating>PG</rating> <stars>2</stars> <description>Viewableboredom</description> </movie> </collection>
Python使用SAX分析xmll
SAX是一种基于事件驱动的API。
使用SAX分析XML文档涉及两个部分:分析器和事件处理器。
分析器负责读取XML文档,并将事件发送到事件处理器,如元素开始与元素结束事件;
事件处理器负责对事件进行相应处理,并处理传输的XML数据。
