zoukankan
html css js c++ java
爬虫基础总结2
headers
形式 字典
User-Agent,Cookies
使用User-Agent能够模拟浏览器
如果因为参数问题爬取不到数据,添加更多参数
params
形式 字典
键是=前面的内容,值是=后面的内容
字符串格式化:'wenshao{}'.format('dashuabi')
post
发送post请求 requests.post(url, data=data)
data形式,字典
proxies(代理)
形式 字典
键:协议
值:协议+ip+port
不是所有代理都支持https的请求和post请求
拨号方式获取的代理ip质量最高
模拟登录
cookies和session的区别
1.cookie储存在浏览器上 2.session储存在服务器上
2.cookie不安全,session更安全
3.session占用服务器性能
4.cookie存储的数据有上限,session没有上限
模拟登录的三种方式
使用session
1.实例化一个session session=requests.session()
2.使用session发送post请求
此时session保存的有对方服务器设置的cookie
3.再使用session请求登录之后才能访问的页面 session.get(url)
将cookie字符串放在headers中
Cookie过期时间很久
cookie过期之前能获取全部的数据
配合其他的程序一起使用,边获取cookie边获取数据
把cookie组成字典,放在请求方法中
字典推导式 {i['name']: i['value'] for i in Cookies }
查看全文
相关阅读:
dategrid快速录入一行数据的一波操作
shiro权限控制入门
Activiti工作流小序曲
在线HTML文档编辑器使用入门之图片上传与图片管理的实现
ActiveMQ整合spring结合项目开发流程(生产者和消费者)总结
缓存框架EhCache的简单使用
关于特征工程入门中的一些基本知识
SQL SERVER常用系统表和常用函数
TestOne
JS 代码调试经验总结
原文地址:https://www.cnblogs.com/wsilj/p/12736159.html
最新文章
[C#] 使用 dnSpy 反编译
[Node.js] mongodb 增删查改
[C#] 发送 http 请求
[驱动开发] 驱动隐藏 driveEntry返回失败
[漏洞] 空指针解引用
[Node.Js] express 处理 get&post 请求
[Rootkit] 驱动隐藏 断链
[检测&过检测] 重写 ReadProcessMemory 、WriteProcessMemory
[Rootkit] 进程替换
[VT 虚拟化] 资料整合
热门文章
[Node.js] 处理 Get&Post 请求
[Node.js] rsa&aes 加密解密
[Rootkit] 进程隐藏 内存加载(进程寄生)
[Node.js] 入坑
[C++功能函数] 判断文件&目录是否存在
[Node.js] VS2019 开发环境搭建 + Hello World 实例
[C#] 代码混淆和加壳
Elasticsearch全文检索工具入门
浅谈WebService之JAXRS与spring整合
Redis整合spring总结
Copyright © 2011-2022 走看看