zoukankan      html  css  js  c++  java
  • 爬虫相关知识(二 )xpath

    #xpath表达式的基本格式
    
    # 斜杠(/)作为路径内部的分割符。
    
    # 同一个节点有绝对路径和相对路径两种写法。
    
    # 绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。
    
    # 相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。
    
    # "."表示当前节点。
    
    # ".."表示当前节点的父节点
    选择节点的基本规则
    
    - nodename(节点名称):表示选择该节点的所有子节点
    
    - "/":表示选择根节点
    
    - "//":表示选择任意位置的某个节点
    
    - "@": 表示选择某个属性
    通配符
    
    # "*"表示匹配任何元素节点。
    
    # "@*"表示匹配任何属性值。
     //title[@*] :表示选择所有带有属性的title元素。
     # node()表示匹配任何类型的节点。 
    选择多个路径
    
    用"|"选择多个并列的路径。
    
    //book/title | //book/price :表示同时选择book元素的title子元素和price子元素。
  • 相关阅读:
    eclipse连接远程hadoop集群开发时0700问题解决方案
    螺旋线
    双曲抛物面
    双曲抛物面
    工业相机标定相关知识整理
    高科技 stuff
    高科技 stuff
    杜甫诗百首
    杜甫诗百首
    经典纪录片
  • 原文地址:https://www.cnblogs.com/dingyutao/p/9127180.html
Copyright © 2011-2022 走看看