在http 协议中,post 提交的数据需放在消息主体的,但协议并没有规定必须使用什么编码方式,从而导致了提交方式的不同。服务端根据请求同一种的 Content-Type 字段来获取请求中消息主体是用何种方式进行编码,再对消息主体进行解析。
具体的编码方式有:
- application/x-www-form-urlencoded # 以form表单形式提交数据,最常见也是大家最熟悉的 - application/json # 以json串提交数据。 - multipart/form-data # 上传文件
下面使用requests来发送上述三种编码的POST 请求
1、提交Form 表单 "Content-Type": "application/x-www-form-urlencoded"
requests提交Form表单,一般存在于网站的登录,用来提交用户名和密码。以 http://httpbin.org/post 为例,在requests中,以form表单形式发送post请求,只需要将请求的参数构造成一个字典,然后传给requests.post()的data参数即可。
代码如下:
d = {"key1":"value1","key2":"value2"}
r = requests.post(url, data=d) # requests.post() 中利用 data 属性
print(r.text)
输出效果如下:
{
"args": {},
"data": "",
"files": {},
"form": {
"key1": "value1",
"key2": "value2"
},
"headers": {
"Accept": "*/*",
"Accept-Encoding": "gzip, deflate",
"Content-Length": "23",
"Content-Type": "application/x-www-form-urlencoded",
"Host": "httpbin.org",
"User-Agent": "python-requests/2.22.0",
"X-Amzn-Trace-Id": "Root=1-60c06a74-78d1256647615a962d76bf9b"
},
"json": null,
"origin": "219.133.170.253",
"url": "http://httpbin.org/post"
}
httpbin.org 网站可以显示你提交请求的内容,输出的”Content-Type”:”application/x-www-form-urlencoded”,证明这是提交Form的方式。
2、提交json串 "Content-Type": "application/json"
对于提交json串,主要是用于发送ajax请求中,动态加载数据。
下面把请求头和请求实体列举一下:
错误写法:
import requests
url = "http://lazytools.feidee.cn/v1/qrcode/log"
data = {
"category": 0,
"content": "。。。。。hahha'a",
"source": 1
}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat",
"Accept-Encoding": "gzip, deflate",
"Accept": "application/json, text/javascript, */*; q=0.01",
"Connection": "keep-alive",
"Content-Type": "application/json",
"Host": "lazytools.feidee.cn"
}
r = requests.post(url=url,data =data,headers=headers)
print(r.text)
打印内容如下:
{"code":-1,"data":null,"message":"请求参数解析失败"}
即使写上了 'Content-Type':'application/json; charset=UTF-8' ,返回依然出错了,原因就在于 你的请求实体的格式错了,服务端无法解码。
正确写法1:
正确代码是把data进行json编码,再发送。代码如下:
r = requests.post(url=url,data=json.dumps(data),headers=headers) # 利用 json 对 字典序列化
这个时候再看一下打印内容,已经成功了
正确写法2:
处理将data主动编码为json发送之外,requests还提供了一个json参数,自动使用json方式发送,而且在请求头中也不用显示声明 'Content-Type':'application/json; charset=UTF-8'。
完整代码如下
import requests
url = "http://lazytools.feidee.cn/v1/qrcode/log"
data = {
"category": 0,
"content": "。。。。。hahha'a",
"source": 1
}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36 MicroMessenger/7.0.9.501 NetType/WIFI MiniProgramEnv/Windows WindowsWechat",
"Accept-Encoding": "gzip, deflate",
"Accept": "application/json, text/javascript, */*; q=0.01",
"Connection": "keep-alive",
"Host": "lazytools.feidee.cn"
}
r = requests.post(url=url,json =data,headers=headers) # 直接把字典传给 requests.post() 的 json 参数
print(r.text)
3、上传文件 "Content-Type": "application/x-www-form-urlencoded"
上传文件在爬虫中使用的很少,不过还是使用requests讲解一下使用方式。Content-Type类型为multipart/form-data,以multipart形式发送post请求,只需将一文件传给 requests.post() 的files参数即可。还是以 http://httpbin.org/post 为例,代码如下:
url = 'http://httpbin.org/post'
files = {'file': open('upload.txt', 'rb')}
r = requests.post(url, files=files) # 文件传给 requests.post() 的 files 参数
print(r.text)