zoukankan      html  css  js  c++  java
  • scrapy框架

    什么是scrapy

    • 爬虫中封装好的一个明星框架
    • 功能:高性能的持久化存储,异步的数据下载,高性能的数据解析,分布式

    scrapy框架的基本使用

    环境的安装:

    mac or linux :pip insatall scrapy

    window:

    -  pip install wheel
    - 下载twisted,下载地址为http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
    - 安装twisted:pip install Twisted‑17.1.0‑cp36‑cp36m‑win_amd64.whl
    - pip install pywin32
    - pip install scrapy
    测试:在终端里录入scrapy指令,没有报错即表示安装成功!

    什么是scrapy

    • 爬虫中封装好的一个明星框架
    • 功能:高性能的持久化存储,异步的数据下载,高性能的数据解析,分布式

    scrapy框架的基本使用

    环境的安装:

    mac or linux :pip insatall scrapy

    window:

    -  pip install wheel
    - 下载twisted,下载地址为http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
    - 安装twisted:pip install Twisted‑17.1.0‑cp36‑cp36m‑win_amd64.whl
    - pip install pywin32
    - pip install scrapy
    测试:在终端里录入scrapy指令,没有报错即表示安装成功!

    创建一个工程:scrapy startproject xxxPro

    cd xxxPro

    在spiders子目录中创建一个爬虫文件

    scrapy genspider spiderName www.xxx.com

    执行工程:scrapy crawl spiderName

  • 相关阅读:
    排球教练积分程序
    排球积分程序
    排球积分程序
    14周总结
    本周总结
    排球计分规则
    我与计算机
    排球计分程序
    《如何成为一个高手》观后感
    十八周总结
  • 原文地址:https://www.cnblogs.com/nanjo4373977/p/12972292.html
Copyright © 2011-2022 走看看