python中htmlparser解析html-图灵python

400-090-8899

导航

图灵python

首页

关于我们

课程大纲

图灵AI

图灵资讯

Python全套实战项目

当前位置：首页 > 图灵资讯 > 行业资讯> python中htmlparser解析html

python中htmlparser解析html

发布时间:2024-07-04 14:42:11

说明

1、htmlparser为处理html文件提供了方便简洁的方法。

它根据树形结构将html页面中的标签分析成一个节点，一个类型的节点对应于一个类，通过调用它可以轻松访问标签中的内容。

2、html本质上是xml的子集，但html的语法不如html严格，不能用标准的DOM或SAX来分析html。

实例

fromhtml.parserimportHTMLParser
fromhtml.entitiesimportnamecodepoint

classMyHTMLParser(HTMLParser):

defhandle_starttag(self,tag,attrs):
print('<%s>'%tag)

defhandle_endtag(self,tag):
print('</%s>'%tag)

defhandle_startendtag(self,tag,attrs):
print('<%s/>'%tag)

defhandle_data(self,data):
print(data)

defhandle_comment(self,data):
print('<!--',data,'-->')

defhandle_entityref(self,name):
print('&%s;'%name)

defhandle_charref(self,name):
print('&#%s;'%name)

parser=MyHTMLParser()
parser.feed('''<html>
<head></head>
<body>
<!--testhtmlparser-->
<p>Some<ahref=\"#\">html</a>HTMLtutorial...<br>END</p>
</body></html>''')

///test结果
<html>


<head>
</head>


<body>


<!--testhtmlparser-->


<p>
Some
<a>
html
</a>
HTMLtutorial...
<br>
END
</p>


</body>
</html>

以上是python中htmlparser分析html，希望对大家有所帮助。更多Python学习指导：python基础教程

本文教程操作环境：windows7系统Python 3.9.1，DELL G3电脑。

上一篇python中值传递和引用传递的区别

下一篇 python操作xml的两种方法

相关文章

如何让vim支持python3

如何让vim支持python3

python2.7和3.6区别有哪些

python2.7和3.6区别有哪些

python3有serial库吗

python3有serial库吗

python中w、r表示什么意思

python中w、r表示什么意思

python中如何把list变成字符串

python中如何把list变成字符串

python命名空间是什么

python命名空间是什么