Scrapy shell调试返回403错误 - 走看看

zoukankan html css js c++ java

Scrapy shell调试返回403错误
(1):第一种方法是在命令上加上-s USER_AGENT='Mozilla/5.0'

(2):第二种方法是修改scrapy的user-agent默认值

找到Python的:安装目录下的default_settings.py文件,

C:Program Files (x86)Anaconda2envsscrapyLibsite-packagesscrapysettingsdefault_settings.py

修改269行，USER_AGENT；

USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'

(2):第在请求头部构造一个User Agent，如下所示：
1 def start_requests(self): 2 yield Request("http://www.baidu.com/", 3 headers={'User-Agent': "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"})
查看全文

相关阅读:
SpringMVC使用ResponseEntity实现文件下载，及图片base64的字节数组上传于下载
 File类的createNewFile()和mkdirs() mkdir()
为什么Java里的Arrays.asList不能用add和remove方法？
java如何向数组里添加元素
 java里getPath、 getAbsolutePath、getCanonicalPath的区别
 MultipartFile 类
 File类的createNewFile()与createTempFile()的区别
 IntelliJ Idea解决Could not autowire. No beans of 'xxxx' type found的错误提示
 FileInputStream读取的两种方法:逐字节读；以字节数组读取
 JCE cannot authenticate the provider BC

原文地址：https://www.cnblogs.com/luolizhi/p/6821234.html

Copyright © 2011-2022 走看看