采用lxml进行xml的解析操作,在使用find()和findall()方式进行操作的时候,如果match按照XPath标准写的复杂点儿,某些情况下会碰到invalid predicate错误。
从lxml的官方文档上来看,lxml是支持XPath1.0标准的,可为何还报出invalid predicate错误呢?
仔细查阅lxml文档才发现:
原来,lxml为了和python标准库中的xml.etree.ElementTree兼容,采用了和xml.etree.ElementTree同样的策略。xml.etree.ElementTree中的find和findall对XPath的支持本身就是有限的,只能算是支持了XPath的一个子集。lxml对XPath的支持体现在xpath()方法中,如果不考虑兼容性的问题,全部采用xpath()来操作即可
参阅:
http://lxml.de/FAQ.html#what-are-the-findall-and-xpath-methods-on-element-tree
http://stackoverflow.com/questions/6218126/xpath-predicate-with-sub-paths-with-lxml