Python爬虫经验 - 走看看

zoukankan html css js c++ java

Python爬虫经验

有时候读取同一个url，服务器可能会返回不同的response，并不是爬虫程序代码的问题，而是服务器的问题，初次试验request时，最好把response文本保存在一个txt文件当中，以便后续的比对。得到response文本之后就可以利用正则表达式或通过查找字符串来获取信息了。

只做get请求时，requests.get(url)和urllib.open(url).read()效果是相同的。

要熟练使用requests库或urllib2库，做get,post请求数据，设置参数，获取head及body。（待续）

查看全文

相关阅读:
功能测试
 数据库
 loadrunner
笔记
 基础知识
 类方法, 实例方法, 静态方法
 统计英文单词次数
 合并文件内容
 字典排序
 排序算法

原文地址：https://www.cnblogs.com/aaronhoo/p/5251635.html

Copyright © 2011-2022 走看看