zoukankan      html  css  js  c++  java
  • 001 Python网络爬虫与信息提取 课程前序

    [A] 主要课程内容

      1.  学习 Requests 库:自动爬取HTML页面,自动发送完网络请求

      2. 学习 robots.txt :网络爬虫排除标准

      3. 学习 Becautiful Soup 库:能很好的解析HTML页面,并且提取相关信息

      4. 实战项目A/B Projects

      5. 学习正则表达式库 Re:正则表达式详解,提取页面关键信息

      6. 学习网络爬虫框架 Scrapy:网络爬虫原理介绍,专业爬虫框架介绍

    [B] 内容组织 

      12个单元:8个内容单元 + 4个实例单元

    [C] 常见 Python IDE工具

      文本类工具 IDE: IDEL 和 Sublime Text

      集成工具类 IDE: Pycharm,Anaconda $ Spyder

  • 相关阅读:
    Ubuntu 18.04 初始化(server版本 )
    named主从环境部署
    CentOS 源码安装svn
    端口状态
    进程状态
    top命令详解
    gitlab部署
    day16
    day15
    day14
  • 原文地址:https://www.cnblogs.com/carreyBlog/p/13976521.html
Copyright © 2011-2022 走看看