LXML - TianYu118/Python GitHub Wiki

关于lxml模块

  lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。XPath(XML Path Language,XML路径语言)是一门在XML文档中查找信息的语言,最初是用于搜索XML文档,但是它同样适用于HTML文档的搜索。

  XPath的选择功能十分强大,它提供了非常简明的路径选择表达式。另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点都可以用XPath来选择。

import lxml
from lxml import etree

图片 图片