zoukankan html css js c++ java

scrapy设置cookie的三种方式

1.如果是在headers中使用

    def start_requests(self):
        headers = {
            "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36",
            "cookie":"你的微博cookie"
        }
        url = "https://weibo.com/u/{}".format("你的微博id")
        yield Request(url, callback=self.parse, headers=headers)

那么需要把settings.py的COOKIES_ENABLED设置为false

COOKIES_ENABLED = False

2.如果使用cookies=cookies的方式设置cookie
那么需要把settings.py的COOKIES_ENABLED设置为true

COOKIES_ENABLED = True

3.使用cookiejar

COOKIES_ENABLED = True

代码示例

class CookieTestSpider(scrapy.Spider):
    name = 'usecookie'
    cookie_dict = {
        "SUB": "你的微博cookie"}
    headers = {
        "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36",
    }
    weibo_id = "你的微博主页id"
    def start_requests(self):
        url = "https://weibo.com/u/{}".format(self.weibo_id)
        yield Request(url, callback=self.parse, headers=self.headers, cookies=self.cookie_dict, meta={'cookiejar': 1})

    def parse(self, response):
        source = response.text
        url = "https://weibo.com/u/{}".format(self.weibo_id)
        if u"我的主页" in source:
            print "找到了"
            yield scrapy.Request(url, headers=self.headers, meta={'cookiejar': response.meta['cookiejar']},
                                 callback=self.parse_page, dont_filter=True)
        else:
            print "没有cookie"

    def parse_page(self, response):
        source = response.text
        if u"我的主页" in source:
            print "又找到了"
        else:
            print "没有cookie"

首先在start_requests中,在meta里添加一个cookiejar属性,这个键必须这个名,然后是后面值可以从0开始，如果多个start_url可以使用列表的里url对应的下标作为cookiejar的值,
程序可以通过传入的不同值传递多个start_url的cookie。
后面需要使用cookie地方使用meta={'cookiejar': response.meta['cookiejar']}即可。
这种方法的好处:

这种是通过meta的方式,将为spider维护多个独立的cookie会话。如果使用cookies ={}，则必须手动维护单独的cookie会话。

下面这个图是cookiejar的调用栈

查看全文

相关阅读:
【算法研究】目标检测
 【Java学习笔记】Java中方法和成员变量的访问控制
 DevExpress XtraReports 入门一创建 Hello World 报表
 整理点dropdownList的应用
 Developer Express 之 XtraReport报表预览控件PrintControl设置
 C#实现winform仿div+css半透明遮罩效果
 动态传递参数到DevExpress.XtraReports的小结 .
Developer Express 之 XtraReport如何显示设计窗体，打开已设计过的报表
 Developer Express 之 XtraReport如何动态绑定数据
 c#判断右键菜单(ContextMenuStrip)是从哪个控件弹出来的方法

原文地址：https://www.cnblogs.com/c-x-a/p/14141592.html