xpath用发 - 走看看

zoukankan html css js c++ java

xpath用发
xpath的更多语法: https://docs.microsoft.com/zh-cn/previous-versions/dotnet/netframework-2.0/ms256039(v=vs.80)?redirectedfrom=MSDN

注意：使用xpath helper或者chrome中的copy xpath都是从element中提取数据的，但是爬虫获取的是url对应的响应，往往和elements不一样

1.获取文本
html/head/title/text() # 获取html下head下title的文本获取title下的文本文本里不包含下一级
html/head/title//text() # 获取title下所有的文本包含下一级的文本
2.获取属性
head/link/@href # 获取head下的link的href属性
3.定位

//标签名[@属性名="属性值"]
//section[@id="list"]/section//div[@class="_20vb2"]/p/text()
4.本节点"."和上一节点".."
html/head/./../body
5.根据文本内容获取标签
//a[text()="下一页"]/@href # 根据下一页文本获取a标签链接地址
6.包含
html.xpath("//li[contains(@class,'item-1')]/a/@href") # class要用小括号包住
7.节点选择语法

查找某个特定的节点或者包含某个指定的值的节点

选择未知节点

选取若干路径
查看全文

相关阅读:
原创《小白的Java自学课》第一课：Java是什么？Java到底能干嘛？
谷歌chrome浏览器
 QT学习之QPair类
 char 与 signed char 和 unsigned char三者之间的关系
 QT学习之QT判断界面当前点击的按钮和当前鼠标坐标
 QT学习之QScript
QT Creater 配色方案及下载
 QT学习之QString的arg方法
 QT创建与调用Dll方法（包括类成员）--显式调用
 C++学习之显式类型转换与运行时类型识别RTTI

原文地址：https://www.cnblogs.com/yifengs/p/11733822.html

Copyright © 2011-2022 走看看