zoukankan      html  css  js  c++  java
  • 5.xpath语法

    from lxml import etree
    
    s="""<div>
        <ul>
             <li class="item-0"><a href="代码link1.html">erfirst item</a></li>
             <li class="item-1"><a href="link2.html">second item</a></li>
             <li class="item-inactive"><a href="link3.html">third item</a></li>
             <li class="item-1"><a href="link4.html">fourth item</a></li>
             <li class="item-0"><a href="link5.html">fifth item</a>
         </ul>
     </div>"""
    res=etree.HTML(s) #将指定的字符串进行解析
    print(etree.tostring(res))
    red=res.xpath("/html/body/div/ul/li/a/@href")   #根据指定的xpath语法来查找相关内容
    #//从全局进行查找的标签
    #/从当前标签下查找指定的标签
    #[num]表示要父级目录下的指定顺序标签
    #[限制条件]根据限制条件找到指定的标签
    #text()  打印标签中的内容
    #@标签属性 指定相关属性
    print(red)
    
    # for i in res:
    #     #显示element对象需要用到etree.tostring函数
    #     print(etree.tostring(i,encoding="utf8").decode("utf8"))
  • 相关阅读:
    InterLockedIncrement and InterLockedDecrement
    bzoj2763
    bzoj1922
    bzoj1705
    bzoj1040
    bzoj3039
    bzoj1801
    bzoj2565
    bzoj1976
    一类最小割bzoj2127,bzoj2132 bzoj3438
  • 原文地址:https://www.cnblogs.com/manjian/p/14148084.html
Copyright © 2011-2022 走看看