zoukankan      html  css  js  c++  java
  • selenium中的xpath用法,使用xpath定位元素

    xpath路径选择器定位元素

    1. xpath:

    使用路径表达式来定位xml或者html中文档中选取节点。 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)

    假设xml文档为:

    <?xml version="1.0" encoding="ISO-8859-1"?>

    <bookstore>

    <book>

      <title lang="en">Harry Potter</title>

      <author>J K. Rowling</author>

      <year>2005</year>

      <price>29.99</price>

    </book>

     

    </bookstore>

    文档节点<bookstore>

    元素节点<author>J K. Rowling</author>

    属性节点lang="en"

    文本:2005

    节点Parent):每个元素以及属性都有一个父。book 元素是 title、author、year 以及 price 元素的父

    子节点Children):节点可有零个、一个或多个子节点title、author、year 以及 price 元素都是 book 元素的子

    同胞(Sibling)拥有相同的父的节点title、author、year 以及 price 元素都是同胞

    先辈(Ancestor)某节点的父、父的父,等等。title 元素的先辈是 book 元素和 bookstore 元素

    后代(Descendant)某个节点的子,子的子,等等。bookstore 的后代是 book、title、author、year 以及 price 元素

    2. 基础语法:

    1) 路径表达式

    表达式

    描述

    nodename

    选取此节点的所有子节点。

    /

    从根节点选取。(可以理解为后面跟的是绝对路径)

    //

    从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。(相对路径)

    .

    选取当前节点。

    ..

    选取当前节点的父节点。

    @

    选取属性。后面跟属性名

    2) 谓语(Predicates)

    放在方括号[]中,相当于筛选条件,用来查找[]中指定的特定节点或者包含某个指定的值的节点。在下面的表格中,列出了带有谓语的一些路径表达式,以及表达式的结果:

    路径表达式

    结果

    /bookstore/book[1]

    选取属于 bookstore 子元素的第一个 book 元素。

    /表示绝对路径,所以后面跟的是根节点bookstore,[]内部的数字表示第几个[]前面的元素,也就是第1个book元素,注意这里的编号是从1开始。

    /bookstore/book[last()]

    选取属于 bookstore 子元素的最后一个 book 元素。

    /bookstore/book[last()-1]

    选取属于 bookstore 子元素的倒数第二个 book 元素。

    /bookstore/book[position()<3]

    选取最前面的两个属于 bookstore 元素的子元素的 book 元素。

    //title[@lang]

    @lang表示lang属性,//title表示选取所有title元素,这个表达式表示的是选取所有带 lang 属性的 title 元素。

    //title[@lang='eng']

    选取所有 title 元素,且元素的lang属性值为eng

    /bookstore/book[price>35.00]

    选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。

    /bookstore/book[price>35.00]/title

    选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。

    XPath 通配符可用来选取未知的 XML 元素。

    通配符

    描述

    *

    匹配任何元素节点。

    @*

    匹配任何属性节点。

    node()

    匹配任何类型的节点。

    在下面的表格中,列出了一些路径表达式,以及这些表达式的结果:

    路径表达式

    结果

    /bookstore/*

    选取 bookstore 元素的所有子元素。

    //*

    选取文档中的所有元素。

    //title[@*]

    选取所有带有属性的 title 元素。

    3) xpath轴

    亲属关系匹配

    例子

    结果

    /bookstore/child::book

    child表示子节点,child::book就是子节点名为book的节点,整个表达式就是说bookstore节点的所有子节点名字为book的节点

    attribute::lang

    attribute表示属性名,表达式为选取当前节点的 lang 属性。

    child::*

    选取当前节点的所有子元素。

    attribute::*

    选取当前节点的所有属性。

    child::text()

    选取当前节点的所有文本子节点。

    child::node()

    选取当前节点的所有子节点。

    descendant::book

    选取当前节点的所有 book 后代。

    ancestor::book

    选择当前节点的所有 book 先辈。

    ancestor-or-self::book

    选取当前节点的所有 book 先辈以及当前节点(如果此节点是 book 节点)

    child::*/child::price

    选取当前节点的所有 price 孙节点。

    parent::*

    找到父级元素

    following::*

    选取文档中当前节点的结束标签之后的所有节点

    preceding::*

    选取文档中当前节点的开始标签之前的所有节点。

    preceding-sibling::*

    选取当前节点之前的所有同级节点

    following-sibling::*

    选取当前节点之后的所有同级节点

    descendant::*

    选取当前节点的所有后代元素(子、孙等)

    例如有一段html的内容如下

    <div>

    <span>text</span>

    <input id = ‘123’>

    </div>

    此时如果想要获取第二个span标签,可以这样写:

    //input[@id='123']/preceding-sibling::span

    input标签比较好找,先找到input标签,然后找它的兄弟节点。preceding-sibling表示找前面的元素的同级元素,后面的::span表示找的是span标签。

    4) Xpath运算符

    在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

    路径表达式

    结果

    //book/title | //book/price

    选取 book 元素的所有 title 和 price 元素。

    //title | //price

    选取文档中的所有 title 和 price 元素。

    /bookstore/book/title | //price

    选取属于 bookstore 元素的 book 元素的所有 title 元素,以及文档中所有的 price 元素。

    5) xpath常用函数

    实例

    返回值

    last()

    返回当前上下文中的最后一个节点的位置号码数

    position()

    返回当前节点的位置的数字,位于第多少个

    //book[position()=2]等价于//book[2]

    例子:

    路径表达式

    结果

    //div[last()]

    最后一个div

    //div[last()-1]

    倒数第二个div

    //div[position()<3]

    前两个div

    //div[@id='id3']//p[last()]

    第三个div中最后一个p标签对象

    //div[@href='http://www.baidu.com']

    选取连接为http://www.baidu.com的属性

    //*[@id='id3']//p[contain(.,'20')]

    在第3个div中找包含20的文本节点

    //*[@id='id3']//p[contain(.,'20')]//fowing-sibiling::p

    选取包含字符串20文本节点的下一个节点的p节点

    3. 补充几个常用方法

    3.1 contains

    包含,比如//div[contains(@class,'xx')]

    查找div元素,元素的class属性值包含xx

    3.2 starts-with

    以某某开头,例如

    //input[starts-with(@class,'xx')]

    查找input元素,元素的class属性值以xx开头

    3.3 ends-with

    以某某结尾,例如:

    //input[starts-with(@class,'xx')]

    查找input元素,元素的class属性值以xx结尾

    3.4 not

    否定的意思,比如:

    input[not(id='123')]

    查找id值不是123的input元素。

    //span[not(contains(text(),'123'))]

    查找一个文本内容不包含123的span标签。

    3.5 *通配符

    *表示通配符,比如://span[@*='123']

    span标签的任何属性为123的元素

    4. 定位原则

    以百度首页为例

    1) id定位,比如//input[@id="su"]

    2) 用元素文本 比如//input[@value="百度一下"]

    3) 用元素的唯一属性,找到这个元素的唯一属性,写法同上

    4) 用元素的多个属性组合,比如//*[@id="kw" and @name ="wd"]

    5) contains模糊匹配,比如//div[@id="u"]/a[contains(.,"录")]。或者可以写//div[@id="u"]/a[contains(@href,"passport")]

    6) 找到已查找的元素,然后基于此元素的相对位置定位,比如先找到一个div,再通过找到的这个div找他的父亲或者兄弟,子女。//div[@id="u"]/child::node(),先找到一个id属性为u的div,再找到这个div的所有孩子节点,后面跟[1],就是这些孩子节点的第一个节点。

  • 相关阅读:
    微信小程序
    如何在微信小程序中使用骨架屏
    Nlog打印日志到Influxdb数据库
    C#通过模板导出Word的两种方法(超简单)
    VS2019制作的安装包,默认安装到C盘快捷方式无法打开
    orcale数据库还原备份
    Thread 类创建线程
    Quartz.NET
    DataTable ,使用详细。
    Unity3D 学习
  • 原文地址:https://www.cnblogs.com/sy_test/p/12201868.html
Copyright © 2011-2022 走看看