<div>
<a href="xxxx">123</a>
<a href="xxxx">45</a>
<div>
<div>
123
45
<div>
请问使用lxml的etree,etree.xpath 怎么一种方式获取内容 div里的12345?
方案1.lxml有一个html模块导入
from lxml import html root = html.fromstring('''<div><a href="xxxx">123</a><a href="xxxx">45</a><div>''') root.text_content()
方案2.etree改用document_fromstring
import lxml.html root = lxml.html.document_fromstring('''<div><a href="xxxx">123</a><a href="xxxx">45</a><div>''') root.text_content()