scrapy概述。 - 走看看

zoukankan html css js c++ java

scrapy概述。

scrapy框架：

下载页面；解析；并发，深度。

scrapy engine：相当于while循环，调用调度器的url。

scheduler(调度器)：所以的url存储。

在实际中，只需要编写spiders即可。

使用scrapy：指定初始的url;

　　　解析器响应内容

　　　　　-给调度器

　　　　　-给item,pipeline,用于格式化，持久化。（相当于导出数据）

例子：

　　在cmd中，scrapy startproject day5_21

　　　　　　　cd day5_21

　　　　　　　scrapy genspider chouti chouti.com

　　　　　　　打开chouti.py进行编辑，

　　　　　　　

scrapy crawl chouti --nolog(scrapy -help)

没有运行出结果。

查看全文

相关阅读:
电子书、API、帮助文档链接收藏
 .net上传图片我自己的可下载资源
 VS2012+EF5学习MVC4（二）
VS2012+EF5学习MVC4（三）
MVC 3.0 的新特性
 最受欢迎的ASP.NET的CMS下载
 简易甘特图 .net javascript
VS2010+EF Code First 4.1学习MVC3（三）
winform WebBrowser 文件下载拦截获取文件本地保存路径
 一次偶遇 IOException

原文地址：https://www.cnblogs.com/lxm-001/p/10900221.html

Copyright © 2011-2022 走看看