xpath无所不能定位。
https://www.w3.org/TR/xpath/all/#axes
两个神器:firebug、xpath-checker
举例:混合定位
//td[a//front[contains(text(),"从零开始视频")]//input[@type='checkbox']
确认xpath是否是正确的:firefox==>F12==>控制台==》$x(".//*[@id='su']")
第一部分:基础定位:
1。依靠自己属性,文本定位(当f元素的文本text(),属性@是唯一时用)
//td[text()='wangm'] #文本是唯一的td元素
//div[contains(@class,'cux-rightarrowicon-on')] #class属性的值是唯一的div元素
//input[@type='radio' and @value='1'] #两个属性一起确定一个元素
2。依靠父节点定位(当子节点没有唯一可定位的属性,但它的父节点却有唯一的属性时用)
//div[@class='wangm']/div
//div[@id='wangm']/div
// div[@id='testid']/input
3。 依靠子节点定位(当父节点没有唯一定位的属性,但它的子节点有确定的值或者有确定的组合时)
//div[div[@id='wangm']] #中括号是用来描述父子关系的。
//div[div[@name='wangm']]
//div[p[@name='testp']]4。 混合型(实际应用中复杂些)
//div[div[@name='listType']]/img #先用name属性找到子节点div,定位其父div,找的是父div下的img元素。
第二部分:进阶定位:
兄弟姐妹节点
following-sibling #后面的兄妹节点
preceding-sibling #
starts-with #以什么内容开头 语法与contains一样。
contains #包含什么内容
not
//input[@id='1234'] /following-sibling::input #后面的兄妹input节点
//input[@id='1234'] /preceding-sibling::span #前面的兄妹sapn 节点
//input[starts-with(@id,123')] #以123开头的Id属性的内容的input元素。
//span[not(contains(text(),'xpath'))] #寻找text内容不包含xpath的span元素。
补充整理:
绝对路径 :html/body/div/span[2]/input[4] 中间结构变化,就失效
相对路径: //开始 在整个html source里找,不管在什么位置
索 引:[x] 从1开始,而不是从0开始 如://div/input[2] #div下面第2个input
误解://span[28] #一个页面上虽然有28个span,但只有放在同一个根节点下才是span[28]能定位到。
关键字:position:索引也可以认为是一个position
last: 同上
//div[@id='test']/span[position()=1] ==== //div[@id='test']/span[1]
//div[@id='test']/span[position()<3] ==== //div[@id='test']/span[1] //div[@id='test']/span[2]
//div[@id='test']/span[last()-1] ==== 最后第二个
//div[@id='test']/span[last()-2] ==== 最后第三个
属性定位: @class
功能关键字:
常用的: and / [][] , or, not, contains, starts-with(无end-with)
and #多个属性共同定位一个元素 //span[@name='wangm' and text()='wangm'] ==== //span[@name='wangm'][text()='wangm']
or #符合一个属性的就可以定位出来 例子同上。
不常用的: substring,subsring-before , substring-after
substring : 一个属性的值,一部分是固定的,而另一部分是变化的,此时用。且从1开始。 //span[substtring(@name,3,5)=‘wangm’]
三个参数(属性,开始位置,长度) ,长度不写时,表示取到最后。 如name='7-wangm-89'
substring-before: 属性的值,一部分固定,一部分动态,且中间有分隔符 如 name='wangm-789' //span[substtring-before(@name,'-')=‘wangm’]
两个参数(属性,分隔符)
substring-after: 同上 如 name='789-wangm'
通配符: * 代表所表
//sapn[@*='wangm'] #span下任意属性等于wangm的
//*[@*='wangm'] #任意的标签中任意的属性等于wangm的。
Axes 轴
------描述查找范围的-----
parent 父节点 如://div[span[text()='wangm']]/parent::div #当前div的父节点div
ancestor 祖先节点,包括父节点,一层一层向上。 如:
descendant 所有子孙节点找,不管什么位置,简写//
following-sibling #当前元素后面的兄弟姐妹
preceding-sibling #当前元素前面的兄弟姐妹
following #当前元素后面的所有元素,不管是兄弟姐妹还是子孙后代,一直到</html>
preceding #当前元素前面的所有元素,不管是兄弟姐妹还是子孙后代,一直到<html>
ancestor-or-self #祖先节点并包含自己
descendant-or-self #子孙节点并包含自己
如://div[span[text()='wangm']]/parent::div