zoukankan      html  css  js  c++  java
  • lxml中的Xpath的使用

      lxml中的Xpath的使用:

    #coding:utf-8
    import lxml
    import lxml.etree
    text="""
    <div>
        <ul>
             <li class="item-0"><a href="link1.html">first item</a></li>
             <li class="item-1"><a href="link2.html">second item</a></li>
             <li class="item-inactive"><a href="link3.html">third item</a></li>
             <li class="item-1"><a href="link4.html">fourth item</a></li>
             <li class="item-0"><a href="link5.html">fifth item</a> # 注意,此处缺少一个 </li> 闭合标签
         </ul>
     </div>
    """
    '''
    html=lxml.etree.HTML(text) #html处理文本
    print (type(html))
    print html
    print lxml.etree.tostring(html)  
    '''
    
    
    html=lxml.etree.parse("index.html") #parse处理文件
    print(type(html))
    print(html)
    print(lxml.etree.tostring(html))
  • 相关阅读:
    C# 小算法1
    函数 y=x^x的分析
    随机数
    对拍
    Cube Stack
    Permutation
    一笔画问题
    康托展开&&康托逆展开
    待完成
    小错误 17/8/10
  • 原文地址:https://www.cnblogs.com/my-global/p/12454056.html
Copyright © 2011-2022 走看看