zoukankan      html  css  js  c++  java
  • scrapy

    scrapy - 给scrapy 的spider 传值

    方法一:

    在命令行用crawl控制spider爬取的时候,加上-a选项,例如:

    scrapy crawl myspider -a category=electronics
    

      

    然后在spider里这样写:

    import scrapy
    
    class MySpider(scrapy.Spider):
        name = 'myspider'
    
        def __init__(self, category=None, *args, **kwargs):
            super(MySpider, self).__init__(*args, **kwargs)
            self.start_urls = ['http://www.example.com/categories/%s' % category]
            # ...
    

      

    方法二:

    在用scrapyd控制spider的时候,可以向schedule.json发送-d选项加入参数,同样的,也需要在spider的构造函数里如上写法。例如:

    $ curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider -d setting=DOWNLOAD_DELAY=2 -d arg1=val1
    

      

  • 相关阅读:
    第一周作业
    第一次作业
    第八周作业
    第七周作业
    第六周作业
    第五周作业
    第四周作业
    第三周作业
    第二周作业
    第一周作业2
  • 原文地址:https://www.cnblogs.com/konghui/p/11206348.html
Copyright © 2011-2022 走看看