zoukankan      html  css  js  c++  java
  • Python爬虫经验

    有时候读取同一个url,服务器可能会返回不同的response,并不是爬虫程序代码的问题,而是服务器的问题,初次试验request时,最好 把response文本保存在一个txt文件当中,以便后续的比对。得到response文本之后就可以利用正则表达式或通过查找字符串来获取信息了。

    只做get请求时,requests.get(url)和urllib.open(url).read()效果是相同的。

    要熟练使用requests库或urllib2库,做get,post请求数据,设置参数,获取head及body。(待续)

  • 相关阅读:
    功能测试
    数据库
    loadrunner
    笔记
    基础知识
    类方法, 实例方法, 静态方法
    统计英文单词次数
    合并文件内容
    字典排序
    排序算法
  • 原文地址:https://www.cnblogs.com/aaronhoo/p/5251635.html
Copyright © 2011-2022 走看看