使用Xpath获取页面元素
【参见W3C官网说明】
以下Xpath路径都是获取下面地址的元素
可以在console 使用 $x() 执行xpath进行验证
下面列出了最有用的路径表达式:
| 表达式 | 描述 |
|---|---|
| nodename | 选取此节点的所有子节点。 |
| / | 从根节点选取。 |
| // | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。 |
| . | 选取当前节点。 |
| .. | 选取当前节点的父节点。 |
| @ | 选取属性。 |
| * | 匹配任何元素节点。 |
| @* | 匹配任何属性节点。 |
| node() | 匹配任何类型的节点。 |
| | | 通过在路径表达式中使用“|”运算符,您可以选取若干个路径。 |
结合关键字、索引的运用实例
| 路径表达式 | 结果 |
|---|---|
| bookstore | 选取 bookstore 元素的所有子节点。 |
| /bookstore |
选取根元素 bookstore。 |
| bookstore/book | 选取属于 bookstore 的子元素的所有 book 元素。 |
| //book | 选取所有 book 子元素,而不管它们在文档中的位置。 |
| bookstore//book | 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置。 |
| //@lang | 选取名为 lang 的所有属性。 |
| //div/form/input[2] | 匹配 上级节点 div 下节点是 form 中的第二个 input 元素 |
| //div//div[@id='ls']/span[position()=3] | position() 索引函数 |
| //div//div[@id='ls']/span[position()<3] | position() 索引函数 |
| //div//div[@id='ls']/span[last()] | last() 索引 表示同级的最后一个元素 |
| //div//div[@id='ls']/span[last()-1] | last() 索引 表示同级的倒数第二个元素 |
| //div//input[@type='radio' and @value='sx'] | and 匹配的input元素要两个条件同时满足 |
| //div//input[@name='password' or @name="username"] | or 或者的关系,匹配的input元素两个条件满足一个即可 |
| //div//input[not(@id='username')] | not 除了当前条件 匹配div中id不等于username的所有input元素 |
| //a[contains(@class,'btn-primary')] | contains 匹配 a标签的class属性中包含btn-primary元素 |
| //div//input[starts-with(@id,'user')] | starts-with 匹配当前id属性是以'user'开头的所有input元素 |
| //div[substring(@id,1,11)='_mail_input'] | substring 匹配div中id的第1-11个字符内容为 _mail_input 的元素 |
| //div[substring-before(@id,'-')='_mail_input_'] | substring-before 匹配div中id内容在 '-' 之前等于_mail_input_ 的元素 |
| //div[substring-after(@id,'-')='_224' | substring-after 匹配div中id内容在 '-' 之后等于 _224 的元素 |
| bookstore/* | 选取 bookstore 元素的所有子元素。 |
| //* | 选取文档中的所有元素 |
| //title[@*] | 选取所有带有属性的 title 元素。 |
| //input[@*='radio'] | 选取所有属性值中有radio的input元素 |
| //book/title | //book/price | 选取 book 元素的所有 title 和 price 元素。 |
| //title | //price | 选取文档中的所有 title 和 price 元素。 |
| /bookstore/book/title | //price | 选取属于 bookstore 元素的 book 元素的所有 title 元素,以及文档中所有的 price 元素。 |
XPath 轴
轴可定义相对于当前节点的节点集。
| 轴名称 | 结果 |
|---|---|
| ancestor | 选取当前节点的所有先辈(父、祖父等)。 |
| ancestor-or-self | 选取当前节点的所有先辈(父、祖父等)以及当前节点本身。 |
| child | 选取当前节点的所有子元素。 |
| descendant | 选取当前节点的所有后代元素(子、孙等)。 |
| descendant-or-self | 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。 |
| following | 选取文档中当前节点的结束标签之后的所有节点。 |
| parent | 选取当前节点的父节点。 |
| preceding | 选取文档中当前节点的开始标签之前的所有节点。 |
| preceding-sibling | 选取当前节点之前的所有同级节点。 |
| self | 选取当前节点。 |
语法:
轴名称::节点测试[谓语]
实例
| 例子 | 结果 |
|---|---|
| //div[@id='ls']/child::span | 选取所有id=ls的div节点的子元素 span 节点(div的子节点) |
| //span/parent::div | 选取span的父节点是div的所有节点 |
| //span/ancestor::tr | 选择span节点的所有 tr 先辈 |
| //div[@id='ls']/descendant::a | 选取div节点的所有 a 后代 |
| //div[@id='ls']/descendant-or-self::a | 选取div节点的所有 a 后代以及自己本身 |
| //div[@id='ls']/ancestor-or-self::td | 选取div节点的所有 td 先辈以及自己本身 |
| //span[@id='sf']/preceding-sibling::span | 选取当前节点之前的所有同级 span 节点 |
| //span[@id='sf']/following-sibling::span | 选取当前节点之后的所有同级 span 节点 |
| //span[@id='sf']/preceding::a | 选取当前span节点之前的所有 a 节点 |
| //span[@id='sf']/following::a | 选取当前span节点之后的所有 a 节点 |
| //span[@id='sf']/self::span | 选取当前节点span自己 |