zoukankan      html  css  js  c++  java
  • python xpath基础 03

    from lxml import etree
    
    text = '''
    <div>
        <ul>
             <li class="item-0"><a href="link1.html">first item</a></li>
             <li class="item-1"><a href="link2.html">second item</a></li>
             <li class="item-inactive"><a href="link3.html">third item</a></li>
             <li class="item-1"><a href="link4.html">fourth item</a></li>
             <li class="item-0"><a href="link5.html">fifth item</a>
         </ul>
     </div>
    '''
    html = etree.HTML(text)
    result = html.xpath('//li[1]/a/text()')
    print(result)#输出第一个超链接里面的内容
    result = html.xpath('//li[last()]/a/text()')
    print(result)#输出最后一个超链接的内容
    result = html.xpath('//li[position()<3]/a/text()')
    print(result)#输出位置小于3的a标签里面的内容
    result = html.xpath('//li[last()-2]/a/text()')
    print(result)#输出最后一个链接向前移动两个位置的a标签内容
    '''
    
    输出结果:
    ['first item']
    ['fifth item']
    ['first item', 'second item']
    ['third item']
    
    '''
  • 相关阅读:
    通过异常处理错误-2
    通过异常处理错误-1
    线程池
    Synchronized
    持有对象-4
    持有对象-3
    持有对象-2 迭代器深入理解
    ServletContextListener
    持有对象-1
    行为参数化
  • 原文地址:https://www.cnblogs.com/liangliangzz/p/10176302.html
Copyright © 2011-2022 走看看