zoukankan
html css js c++ java
爬虫基础总结2
headers
形式 字典
User-Agent,Cookies
使用User-Agent能够模拟浏览器
如果因为参数问题爬取不到数据,添加更多参数
params
形式 字典
键是=前面的内容,值是=后面的内容
字符串格式化:'wenshao{}'.format('dashuabi')
post
发送post请求 requests.post(url, data=data)
data形式,字典
proxies(代理)
形式 字典
键:协议
值:协议+ip+port
不是所有代理都支持https的请求和post请求
拨号方式获取的代理ip质量最高
模拟登录
cookies和session的区别
1.cookie储存在浏览器上 2.session储存在服务器上
2.cookie不安全,session更安全
3.session占用服务器性能
4.cookie存储的数据有上限,session没有上限
模拟登录的三种方式
使用session
1.实例化一个session session=requests.session()
2.使用session发送post请求
此时session保存的有对方服务器设置的cookie
3.再使用session请求登录之后才能访问的页面 session.get(url)
将cookie字符串放在headers中
Cookie过期时间很久
cookie过期之前能获取全部的数据
配合其他的程序一起使用,边获取cookie边获取数据
把cookie组成字典,放在请求方法中
字典推导式 {i['name']: i['value'] for i in Cookies }
查看全文
相关阅读:
Proxy 相对于 Object.defineProperty 有哪些优点?
Vue 3.0 所采用的 Composition Api 与 Vue 2.x使用的Options Api 有什么区别?
Vue 3.0 性能提升主要是通过哪几个方面体现的?
封装 Vue 组件库
rollup-plugin-postcss ( PostCSS plugin postcss-noop-plugin requires PostCSS 8. Migration guide for end-users:)
LibreSSL SSL_connect: SSL_ERROR_SYSCALL in connection to github.com:443
vue serve 命令不管用
典型80后的5年工作总结
Elasticsearch强大的聚合功能Facet
Mongodb使用总结
原文地址:https://www.cnblogs.com/wsilj/p/12736159.html
最新文章
【第六节】PyQt5对话框
【第五节】PyQt5事件和信号
【第四节】PyQt5菜单和工具栏
【第三节】PyQt5布局管理
【第二节】PyQt5基本功能
【第一节】PyQt5简介
PyQT
centos7安装MongoDB4.0
C++/CLR 使用(VS2012,VS2013,VS2015)编写Windows窗体应用程序(转)
亚马逊 RDS binlog日志 拉取到本地 脚本
热门文章
mobx5相比较mobx4的区别
mobx知识梳理
react-hook useLayoutEffect
React Hooks ---useMemo
React中class 和 style 样式开发
state 和 props 同时改变子组件状态方法
react相关知识
如何避免重复addEventListener?
axios 拦截器
Vue 3.0 在编译方面有哪些优化?
Copyright © 2011-2022 走看看