如何理解XML解析库?
发布时间:2025-09-28 11:07:05
untangle
untangle 这是一个简单的分析方法 XML 文档库。输入一个 XML 文档后,untangle 将文档的结构映射成结点和属性,并返回到一个 Python 对象。
形如以下的 XML 文件:
<?xmlversion="1.0"?> <root> <childname="child1"> </root>
可采用以下方法加载:
importuntangle obj=untangle.parse('path/to/file.xml')
加载完成后,您可以通过运行以下代码获取 child 标签的 name 属性值:
obj.root.child['name']
untangle 支持使用字符串的形式和形式 URL 的形式加载 XML 文档。
xmltodict
xmltodict 它是另一个简单的库,可以让开发者像操作一样操作 JSON 一样操作 XML 文档。
形如以下的 XML 文档:
<mydocumenthas="anattribute"> <and> <many>elements</many> <many>moreelements</many> </and> <plusa="complex"> elementaswell </plus> </mydocument>
可以用以下方法加载,从而获得一个 Python 的 dict 对象:
importxmltodict withopen('path/to/file.xml')asfd: doc=xmltodict.parse(fd.read())
然后,您可以访问文档的元素、属性和属性值:
doc['mydocument']['@has']#==u'anattribute' doc['mydocument']['and']['many']#==[u'elements',u'moreelements'] doc['mydocument']['plus']['@a']#==u'complex' doc['mydocument']['plus']['#text']#==u'elementaswell'
xmltodict 中的 unparse 函数可以根据字典返回一个函数 XML 文档。与此同时, xmltodict 支持流式操作处理不适合内存的文件,并支持命名空间。
下一篇 分分钟搞定JSON解析