zoukankan
html css js c++ java
爬虫基础总结2
headers
形式 字典
User-Agent,Cookies
使用User-Agent能够模拟浏览器
如果因为参数问题爬取不到数据,添加更多参数
params
形式 字典
键是=前面的内容,值是=后面的内容
字符串格式化:'wenshao{}'.format('dashuabi')
post
发送post请求 requests.post(url, data=data)
data形式,字典
proxies(代理)
形式 字典
键:协议
值:协议+ip+port
不是所有代理都支持https的请求和post请求
拨号方式获取的代理ip质量最高
模拟登录
cookies和session的区别
1.cookie储存在浏览器上 2.session储存在服务器上
2.cookie不安全,session更安全
3.session占用服务器性能
4.cookie存储的数据有上限,session没有上限
模拟登录的三种方式
使用session
1.实例化一个session session=requests.session()
2.使用session发送post请求
此时session保存的有对方服务器设置的cookie
3.再使用session请求登录之后才能访问的页面 session.get(url)
将cookie字符串放在headers中
Cookie过期时间很久
cookie过期之前能获取全部的数据
配合其他的程序一起使用,边获取cookie边获取数据
把cookie组成字典,放在请求方法中
字典推导式 {i['name']: i['value'] for i in Cookies }
查看全文
相关阅读:
松软科技web课堂:SQLServer之UCASE() 函数
松软科技web课堂:SQLServer之HAVING 子句
SQLServer之GROUP BY语句
松软科技web课堂:SQLServer之SUM() 函数
松软科技web课堂:SQLServer之MIN() 函数
SQLServer之MAX() 函数
松软科技web课堂:SQLServer之LAST() 函数
松软科技带你学开发:SQL--FIRST() 函数
松软科技带你学开发:SQL--COUNT() 函数
NodeJS初介
原文地址:https://www.cnblogs.com/wsilj/p/12736159.html
最新文章
[jquery]将当前时间转换成yyyymmdd格式
[django]django 在apache2上部署静态文件如何加载
[django]手动数据库备份
[python]获取网页中内容为汉字的字符串的判断
[数据分析]excel带名称的四象限散点图制作
[jquery]if条件句
[django]表格的添加与删除实例(可以借鉴参考)
[转]jquery遍历table的tr获取td的值
[转]jquery append 动态添加的元素事件on 不起作用的解决方案
php学习笔记——学习路线图记录
热门文章
input 输入框 propertychange
填坑——audio不能正常播放,控制台报错 Uncaught (in promise) DOMException
枚举属性和不可枚举属性
MySQL 统计上一周从周一到周日的用户
mysql的yearweek 和 weekofyear函数
Mysql中类似于oracle中nvl()函数的ifnull()函数
mysql 根据日期进行查询数据,没有数据也要显示空
理解sort()函数的排序原理
php 数组去空
松软科技web课堂:SQLServer之MID() 函数
Copyright © 2011-2022 走看看