zoukankan
html css js c++ java
爬虫基础总结2
headers
形式 字典
User-Agent,Cookies
使用User-Agent能够模拟浏览器
如果因为参数问题爬取不到数据,添加更多参数
params
形式 字典
键是=前面的内容,值是=后面的内容
字符串格式化:'wenshao{}'.format('dashuabi')
post
发送post请求 requests.post(url, data=data)
data形式,字典
proxies(代理)
形式 字典
键:协议
值:协议+ip+port
不是所有代理都支持https的请求和post请求
拨号方式获取的代理ip质量最高
模拟登录
cookies和session的区别
1.cookie储存在浏览器上 2.session储存在服务器上
2.cookie不安全,session更安全
3.session占用服务器性能
4.cookie存储的数据有上限,session没有上限
模拟登录的三种方式
使用session
1.实例化一个session session=requests.session()
2.使用session发送post请求
此时session保存的有对方服务器设置的cookie
3.再使用session请求登录之后才能访问的页面 session.get(url)
将cookie字符串放在headers中
Cookie过期时间很久
cookie过期之前能获取全部的数据
配合其他的程序一起使用,边获取cookie边获取数据
把cookie组成字典,放在请求方法中
字典推导式 {i['name']: i['value'] for i in Cookies }
查看全文
相关阅读:
Linux入门实践笔记(二)——Jar包的运行与关闭
SpringCloud从入门到进阶(二)——注册中心Eureka的伪分布式部署
Linux入门实践笔记(一)——安装JDK与运行jar包
探究ConcurrentHashMap中键值对在Segment[]的下标如何确定
探究HashMap线性不安全(三)——死循环的产生
jmeter集成测试报告
jmeter+ant+jenkins持续集成设置
jmeter-环境配置与安装
MySql 基本语法_数据表操作
MySql 基本语法_数据库操作
原文地址:https://www.cnblogs.com/wsilj/p/12736159.html
最新文章
#查找算法#【1】简单查找:顺序、折半查找
#排序算法#【6】排序算法总结
#排序算法#【5】合并排序
#排序算法#【4】快速排序
#排序算法#【3】堆排序
#排序算法#【2】直接插入排序、希尔排序
#排序算法#【1】概述、冒泡排序、选择排序
有点沉重的步伐...
MySQL数据库备份与还原
MySQL数据库、表的字符编码
热门文章
CentOS安装软件出现错误:bash: /usr/local/bin/rar: /lib/ld-linux.so.2: bad ELF interpreter: No such file or directory
Python模块和包
正则表达式整理
[转]我的算法学习之路
产品设计的可用性原则
Docker入门实践笔记(三)一篇文章搞懂Docker下安装Redis,以及Redis与SpringBoot整合
Linux入门实践笔记(四)——Win下安装配置Git以及GitHub项目托管
Linux入门实践笔记(三)——数据盘格式化和和多分区挂载
SpringCloud从入门到进阶(五)——路由接入Zuul及其单点部署
SpringCloud从入门到进阶(六)——使用SpringBoot搭建微服务
Copyright © 2011-2022 走看看