zoukankan      html  css  js  c++  java
  • scrapy shell

    一、scrapy shell

    1、安装pip install Jupyter

    wps7895.tmp 

    2、pycharm中的启动命令: scrapy shell

       注:启动后关键字高亮显示

    wps7896.tmp 

    3、查看response

    执行scrapy shell http://www.521609.com,查看response

     

    wps7897.tmp 

     

    二、Scrapyshell 使用细节

    注:调用:scrapy shell https://www.xxx.com/

    1、Scrapyshell 终端是一个交互终端

    我们可以在未启动spider的情况下尝试及调试代码,也可以用来测试XPathCSS表达式,查看他们的工作方式,方便我们爬取的网页中提取的数据

    2Jupyter

    如果安装了 Jupyter Scrapy终端将使用 Jupyter (替代标准Python终端)Jupyter 终端与其他相比更为强大,提供智能的自动补全,高亮输出,及其他特性。推荐安装Jupyter

    3response

    shell载入后,将得到一个包含response数据的本地 response 变量,输入 response.body将输出response的包体,输出 response.headers 可以看到response响应

    4、response.selector

    输入 response.selector 时, 将获取到一个response 初始化的类 Selector 的对象,此时可以通过使用 response.selector.xpath()response.selector.css() 来对 response 进行查询

    5、执行命令

    1scrapy shell http://www.ichong123.com/pics/

    2执行:li_list = response.xpath('//ul[@class="conlist cf"]/li')

    3执行:len(li_list)   证明有数据

     

    wps7898.tmp 

     

    4)执行:li_list[0].xpath('.//img/@src').extract_first()得到图片

    5)执行:li_list[0].xpath('.//a/text()').extract()[0]得到图片名字

     

    wps7899.tmp 

     

     

    以上是Scrapyshell 的基本使用,谢谢关注!!!

     

    欢迎关注小婷儿的博客:

    csdnhttps://blog.csdn.net/u010986753

    博客园:http://www.cnblogs.com/xxtalhr/

     

    有问题请在博客下留言或加QQ群:483766429 或联系作者本人 QQ 87605025

     

    OCP培训说明连接:https://mp.weixin.qq.com/s/2cymJ4xiBPtTaHu16HkiuA

    OCM培训说明连接:https://mp.weixin.qq.com/s/7-R6Cz8RcJKduVv6YlAxJA

     

    小婷儿的python正在成长中,其中还有很多不足之处,随着学习和工作的深入,会对以往的博客内容逐步改进和完善哒。

    小婷儿的python正在成长中,其中还有很多不足之处,随着学习和工作的深入,会对以往的博客内容逐步改进和完善哒。

    小婷儿的python正在成长中,其中还有很多不足之处,随着学习和工作的深入,会对以往的博客内容逐步改进和完善哒。

    重要的事说三遍。。。。。。

     

     

        wps78AA.tmp    wps78AB.tmp

     

     

     

     

  • 相关阅读:
    Dynamics CRM 2011/2013 通过Javascript给lookup字段赋值
    shell重定向(大于号,小于号,左右,2>&1,&)
    Dynamics CRM2011 同一个FORM表单同一个字段可以摆放多次
    词的向量表示
    机器翻译领域的新突破
    Dynamics CRM2011 隐藏sub-grid 新建项和添加现有项按钮
    sed常用方法与命令
    Dynamics CRM Odata QueryUrl中的SetName问题
    hive发杂数据结构的使用,struct,array,map
    maven 经常使用命令
  • 原文地址:https://www.cnblogs.com/pythonbao/p/9158651.html
Copyright © 2011-2022 走看看