阅读量:0
在Python中使用xpath需要先安装一个解析库,常用的解析库有lxml和html.parser,下面分别介绍它们的安装和使用方法。
安装lxml库: 使用pip命令在命令行中安装lxml库:
pip install lxml
使用lxml解析库进行xpath解析:
from lxml import etree # 创建一个XML解析器 parser = etree.XMLParser() # 解析XML字符串 xmlstr = """ <root> <element>foo</element> <element>bar</element> </root> """ root = etree.fromstring(xmlstr, parser) # 使用xpath选择节点 elements = root.xpath('//element') # 遍历选择的节点 for element in elements: print(element.text)
安装html.parser库: 使用pip命令在命令行中安装html.parser库:
pip install html5lib
使用html.parser解析库进行xpath解析:
from html.parser import HTMLParser # 创建一个HTML解析器 parser = HTMLParser() # 解析HTML字符串 htmlstr = """ <html> <body> <h1>Heading</h1> <p>Paragraph</p> </body> </html> """ parser.feed(htmlstr) # 获取解析结果 root = parser.close() # 使用xpath选择节点 headings = root.xpath('//h1') # 遍历选择的节点 for heading in headings: print(heading.text)
注意:以上示例代码中的XPath表达式是简单的示例,实际中可以根据具体需求编写更复杂的XPath表达式。