zoukankan      html  css  js  c++  java
  • python 3 安装 scrapy 并运行成功

    今天,python 3 安装 scrapy, 并运行成功。特此纪念!

    我的环境:windows 10(64位) + python 3.5.2(64位)

    其中几个要点说明一下:

    1、有几个依赖库需要事先单独安装

    往往,在安装scrapy依赖库,即在

    pip install scrapy
    

    过程中,会出现红色错误的。此时,做两件事

    1. 更新pip: $ python pip install --upgrade pip
    2. lfd下载单独的whl文件,pip安装之(若有多个依赖库安装出现红色文字错误,则此步重复!)

    2、特别地,pywin32的安装问题

    1. lfd下载单独的whl文件,pip安装之
    2. 然后,运行命令$ python pywin32_postinstall.py -install,切记!

    好了,运行官网首页的例子:

    import scrapy
    
    class BlogSpider(scrapy.Spider):
        name = 'blogspider'
        start_urls = ['https://blog.scrapinghub.com']
    
        def parse(self, response):
            for url in response.css('ul li a::attr("href")').re('.*/category/.*'):
                yield scrapy.Request(response.urljoin(url), self.parse_titles)
    
        def parse_titles(self, response):
            for post_title in response.css('div.entries > ul > li a::text').extract():
                yield {'title': post_title}
    

    保存为myspider.py文件,命令行进入此文件夹,运行如下命令,使启动爬虫:

    scrapy runspider myspider.py
    

    OK了,可以看到成功的信息。

  • 相关阅读:
    短信猫软件的实现(C#)<八>7bitPDU的解码
    短信猫软件的实现(C#)<七>短信猫(简化测试版)实现
    短信猫软件的实现(C#)<十一>软件实现(完结篇)
    我的EDA课程设计 Verilog HDL 自动售票机的实现
    Linux JNI(1)
    Notes
    Linux 线程属性
    Linux shared lib
    Linux 几个调试命令
    Java工具
  • 原文地址:https://www.cnblogs.com/hhh5460/p/5707043.html
Copyright © 2011-2022 走看看