lxml.etree 教程5：Using XPath to find text - 走看看

zoukankan html css js c++ java

lxml.etree 教程5：Using XPath to find text
另外一个获取树里面文本内容的方法是XPath，它一样可以把文本内容提取到列表中。
>>> print(html.xpath("string()")) # lxml.etree only! TEXTTAIL >>> print(html.xpath("//text()")) # lxml.etree only! ['TEXT', 'TAIL']
如果你比较频繁使用这个方式，可以包装成一个函数。
>>> build_text_list = etree.XPath("//text()") # lxml.etree only! >>> print(build_text_list(html)) ['TEXT', 'TAIL']
注意到一个XPath返回的字符串结果是一个特殊的“聪明”的对象，它知道它来自何处。
>>> texts = build_text_list(html) >>> print(texts[0]) TEXT >>> parent = texts[0].getparent() >>> print(parent.tag) body >>> print(texts[1]) TAIL >>> print(texts[1].getparent().tag) br
你也可以找出它常规的文本内容或尾部文本:
>>> print(texts[0].is_text) True >>> print(texts[1].is_text) False >>> print(texts[1].is_tail) True
>>> stringify = etree.XPath("string()") >>> print(stringify(html)) TEXTTAIL >>> print(stringify(html).getparent()) None
作者：Shane
出处：http://bluescorpio.cnblogs.com
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。
查看全文

相关阅读:
mybatis入门
 windows环境下搭建RocketMQ
主键-雪花算法
 Springboot杂七杂八
 springboot整合webSocket的使用
 sss
sss
sss
sss
sss

原文地址：https://www.cnblogs.com/bluescorpio/p/3131202.html

Copyright © 2011-2022 走看看