Requests库的七个主要方法:
requests.request()
构造一个请求,支撑一下各方法的基础方法
requests.get()
获取HTML网页的主要方法,对应HTTP的GET
requests.head()
获取HTML网页头的信息方法,对应HTTP的HEAD
requests.post()
向HTML网页提交POST请求方法,对应HTTP的POST
requests.put()
向HTML网页提交PUT请求的方法,对应HTTP的RUT
requests.patch()
向HTML网页提交局部修改请求,对应于HTTP的PATCH
requests.delete()
向HTML页面提交删除请求,对应HTTP的DELETE
get()方法
r = requests.get(url,params = None,**kwargs)
url:网址
params:url中的额外参数,字典或字节流格式,可选
**kwargs:12个控制访问参数
>>>import requests #加载requests模块
>>>r = requests.get('https://www.baidu.com') #爬取url的网址信息
>>>print(r.status_code) #查看状态
200 #200为正常,404为错误
>>>type(r) #查看它的类
<class 'requests.models.Response'> #response类
>>>r.headers #获得头部信息
response对象的属性
r.status_code HTTP请求的返回状态
r.text HTTP响应内容的字符串形式,即:url对应的页面内容
r.encoding 从HTTP header中猜测的响应内容编码方式
r.apparent_encoding 从内容中分析出的响应内容编码方式(备选编码方式)
r.content HTTP响应内容的二进制形式
示例:
>>>import requests
>>>r = requests.get('https://www.baidu.com')
>>>r.status_code
200
>>>r.text
>>>r.encoding
'ISO-8859-1'
>>>r.apparent_encoding
'utf-8'
>>>r.encoding = 'utf-8'
>>>r.text