爬虫开启项目啦

1.创建scrapy项目

scrapy  startproject 项目名
cd 项目名
scrapy genspider chouti chouti.com       创建一个爬取抽屉的爬虫
scrapy genspider -t crawl cnblogs cnblogs.com         创建一个爬取博客的爬虫
scrapy crawl chouti                  编写完成之后启动项目

View Code

2.项目中各个文件的作用介绍

项目名称
    项目名称/
        - spiders                # 爬虫文件 
            - chouti.py 
            - cnblgos.py 
            ....
        - items.py             # 持久化
        - pipelines                # 持久化
        - middlewares.py        # 中间件
        - settings.py             # 配置文件（爬虫）
    scrapy.cfg                    # 配置文件（部署）

View Code

3.项目实战地址，内有包含步骤说明和注释

https://github.com/yangyu57587720/qsbk_spider

查看全文

相关阅读:
为VMware虚拟机内安装的Ubuntu 16.04设置静态IP地址
 WPF入门教程系列二十三——DataGrid示例(三)
WPF入门教程系列二十一——DataGrid示例(二)
Google Nexus 5X刷机并root
web调用摄像头拍照
 导出SQL SERVER 数据字典语句
 树莓派安装.Net Core3.1
使用Open Live Writer写博客
 EFCore的外键级联删除导致的【可能会导致循环或多重级联路径】
重新装Mysql数据的恢复办法，还原data文件夹下数据库

原文地址：https://www.cnblogs.com/Guishuzhe/p/9812556.html