zoukankan      html  css  js  c++  java
  • 在scrapy中利用Selector来提取数据

    1、创建对象

      Selector类的实现位于scrapy.selector模块,创建Selector对象的时候,可以将页面的Html文档字符串传递给Selector构造器方法

    2、选中数据

      调用Selector对象的xpath或者css方法(传入xpath或者css选择器表达式),可以选中文档中的某一部分

      xpath和css方法返回的是一个SelectorList对象,其中包含每个被选中部分对应的Selector对象,SelectorList支持列表接口,可以使用for循环迭代访问其中的每一个Selector对象

    3、提取信息

      调用Selector或者SelectorList对象中的方法可以将选中的内容提取出来

        extract

          SelectorList对象的extract方法会把所有结果收集到一个列表返回给用户

        re

          利用正则表达式提取想要的内容

        extract_first

          返回第一个Selector对象调用extract方法的结果。通常SelectorList对象中只包含一个Selector对象的时候就会调用这个方法

        re_first

  • 相关阅读:
    springmvc中request的线程安全问题
    日志帮助类
    模态框的实现
    getopts的使用方法
    自动生成头文件的脚本
    shell脚本中出现图形化界面
    Linux Centos关机命令
    Linux下IP的存储位置
    tar只解压tar包中某个文件
    Swift 笔记1
  • 原文地址:https://www.cnblogs.com/tulintao/p/11697940.html
Copyright © 2011-2022 走看看