- Requets库的安装
执行 pip install requests
2.Requests库的方法
下面的表格是Requests库中的主要方法:
- get()方法
requests.get(url,params=None, **kwargs)
url: 拟获取页面的url链接
params: url中的额外参数,字典或字节流格式,可选
**kwargs: 12个控制访问的参数
Requests库中包含两个重要对象:
Response对象包含爬虫返回的内容,有服务器返回的所有信息,也包含请求的Request信息。对象的属性如下表所示:
- request()方法
requests.request(method,url,**kwargs) method : 请求方式,对应get/put/post等7种 url: 拟获取页面的url链接 **kwargs: 控制访问的参数,为可选项共13个
method:请求方式如下:
r = requests.request('GET',url,**kwargs)
r = requests.request('HEAD',url,**kwargs)
r = requests.request('POST',url,**kwargs)
r = requests.request('PUT',url,**kwargs)
r = requests.request('PATCH',url,**kwargs)
r = requests.request('delete',url,**kwargs)
r = requests.request('OPTIONS',url,**kwargs)
关于一些**kwargs参数:
-
params: 字典或字节序列,作为参数增加到url中
-
data : 字典、字节序列或文件对象,作为Request的内容
-
json: JSON格式的数据,作为Request的内容
-
headers : 字典,HTTP定制头
- cookies : 字典或CookieJar,Request中的cookie
- auth: 元组,支持HTTP认证功能
-
files : 字典类型,传输文件
-
timeout : 设定超时时间,秒为单位
-
proxies : 字典类型,设定访问代理服务器,可以增加登录认证
- allow_redirects: True/False,默认为True,重定向开关
- stream : True/False,默认为True,获取内容立即下载开关
- verify : True/False,默认为True,认证SSL证书开关
- cert : 本地SSL证书路径
- post()方法
requests.post(url,data=None, json=None, **kwargs)
url: 拟更新页面的url链接
data : 字典、字节序列或文件,Request的内容
json: JSON格式的数据,Request的内容
**kwargs: 12个控制访问的参数
- put()方法
requests.put(url,data=None, **kwargs)
url: 拟更新页面的url链接
data : 字典、字节序列或文件,Request的内容
**kwargs: 12个控制访问的参数
- patch()方法
requests.patch(url,data=None, **kwargs)
url: 拟更新页面的url链接
data : 字典、字节序列或文件,Request的内容
**kwargs: 12个控制访问的参数
- delete()方法
requests.delete(url,**kwargs)
url: 拟删除页面的url链接
**kwargs: 12个控制访问的参数