2 scrapy框架

1、概要

2、步骤

1、

##################### settings文件：#############################
# 头伪装
USER_AGENT = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:68.0) Gecko/20100101 Firefox/68.0'

# Obey robots.txt rules
ROBOTSTXT_OBEY = False

# 只显示print和错误信息
LOG_LEVEL = 'ERROR'

##################### 主文件：#################################
# 注释掉allowed_domains

3.基于观管道的持久化存储

############## 1.items.py #############
class FirstBloodItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()
    url = scrapy.Field()

############## 2.pipelines.py ##########
class FirstBloodPipeline:
    # 专门用来接收和处理item类型对象
    def process_item(self, item, spider):
        return item

############## 3.主文件.py ###########
from first_blood.items import FirstBloodItem

############## 4.settings.py（行） ###########
ITEM_PIPELINES = {
   'first_blood.pipelines.FirstBloodPipeline': 300,
}

查看全文

相关阅读:
【2020-11-01】从身边人开始输出自己的价值
 【一句日历】2020年11月
 【2020-10-31】继续解锁自己内心的矛盾
 【2020-10-29】静下心来，书中自有黄金
 【2020-10-28】平凡人终归还是要回归到小日子上
 【2020-10-27】抗衡自己的摇摆幅度
 【2020-10-26】市场驱动学习和进步
 【2020-10-25】窜着野炊的心干着农民的活
 暑假集训2016day3T1 欧拉回路(UOJ #117欧拉回路)(史上最全的欧拉回路纯无向图/有向图解析)
leetcode1282

原文地址：https://www.cnblogs.com/shendaw/p/13455316.html