zoukankan      html  css  js  c++  java
  • Python网络爬虫开发博文——启航

    大概2016年到2017年的时候,随着人工智能和大4数据的xingqi,Python火起来了,似乎小学也将Python纳入课程。作为毫无目标的小白,自然会随波逐流,也毫无目标的学了一些Python,但是并没有学习网络爬虫。

    如果问我爬虫是什么?我只能说,是获取网站信息的程序和脚本。套用百度百科的话。

    网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

    所以,还不了解爬虫。只是觉得Python是一个优美的高级语言。但是,后来工作中,一直使用.NET,那时候,虽然工资不高,但工作时间长啊,加上琐事和自己的毅力不够鉴定、毫无明确目标,于是,爬虫被我放弃了,Python被我遗忘了。

    最近,在图书馆看书,看到了关于爬虫的书。刘延林的《Python网络爬虫开发——从入门到精通》。(不保证这本书好,只是需要一本入门的书,无论哪一本其实无所谓,关键是行动力)。

     如今,我概览的书籍的目录,打算边学边写博文。虽然不知道以后会不会用上,但从毫无目标的小白变成毫无目标的大白,本着拓宽知识面的原则,还是开始学习了,今天算Python爬虫系列的启动。

    这是我计划的内容。如果粗略的估计的话,一共会有(8+18+4+29+3+6)=68篇。理论上,如果每天写一篇,需要两个月有于的时间。不过,后面的内容只是写出了大概,加上有可能遇到一些问题,需要其他扩展的知识或一些错误,篇幅可能更多。加上生活中有可能有一些其他阻力,自己工作生活中遇到问题也会阻止自己的进度。如果,书籍两个月的时间到了的话。那么,我去买下这本书。反正,计划赶不上变化,但计划还是要有的。

    短期的计划需要细化,长期的,只需要一些粗略的方向。

    现在,我宣布,Python网络爬虫系列博文项目,在今天正式启动了!

    参考网址

     

  • 相关阅读:
    原子变量AtomicInteger
    8.2.2.2 Speed of UPDATE Statements 加速UPDATE语句:
    8.2.2 Optimizing DML Statements 优化DML 语句:
    CSS3中-moz、-ms、-webkit和-o分别代表什么意思
    8.2.1.19 Optimizing LIMIT Queries 优化LIMIT 查询:
    java.lang.IllegalArgumentException: Negative time
    8.2.1.17 DISTINCT Optimization
    Python基本语法_函数_参数的多类型传值
    Python基本语法_函数_参数的多类型传值
    8.2.1.16 GROUP BY Optimization
  • 原文地址:https://www.cnblogs.com/luyj00436/p/15257545.html
Copyright © 2011-2022 走看看