zoukankan      html  css  js  c++  java
  • scrapy中的xpath用法和css的用法

    css

    不包含那个类

    response.css(".list-left dd:not(.page)")

    获取属性和文本

    img.css("a::text").extract_first()
    
    img.css("a::attr(href)").extract_first()

    获取类page-en倒数第二个节点

    response.css(".page-en:nth-last-child(2)::attr(href)").extract_first()

     xpath

    获取<li>标签下hre 为 link1.html 的 <a> 标签

    result = html.xpath('//li/a[@href="link1.html"]')

    获取最后一个 <li> 的 <a> 的 href

    result = html.xpath('//li[last()]/a/@href')

     获取倒数第二个元素的内容

    result = html.xpath('//li[last()-1]/a')

    获取<li> 标签下的所有 <span> 标签

    #result = html.xpath('//li/span')
    #注意这么写是不对的:
    #因为 / 是用来获取子元素的,而 <span> 并不是 <li> 的子元素,所以,要用双斜杠
    
    result = html.xpath('//li//span')
  • 相关阅读:
    Mybatis中#{}与${}的区别:
    JDBC
    JavaScript与jQuery的区别
    JavaScript 高级
    AdminLTE
    servlet过滤器与监听器
    数据库连接池
    大对象数据LOB的应用
    Serializable
    泛型
  • 原文地址:https://www.cnblogs.com/coder-lzh/p/9829554.html
Copyright © 2011-2022 走看看