http协议(2)
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP,使HTTP客户(如Web浏览器)能够从HTTP服务器(Web服务器)请求信息和服务,当一个客户端向服务器端发出请求,然后Web服务器返回响应(response)
- 所有HTTP连接都被构造成一套请求和应答。
====
HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:
1. 建立TCP连接
- 在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同构建Internet,即著名的TCP/IP协议族,因此Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议,根据规则,只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80
2. Web浏览器向Web服务器发送请求命令
- 一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令
例如:GET/sample/hello.jsp HTTP/1.1
3. Web浏览器发送请求头信息
- 浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。
4. Web服务器应答
- 客户机向服务器发出请求后,服务器会客户机回送应答,
HTTP/1.1 200 OK
应答的第一部分是协议的版本号和应答状态码
5.Web服务器发送应答头信息
- 正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。
6.Web服务器向浏览器发送数据
- Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据
7.Web服务器关闭TCP连接
- 一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码
Connection:keep-alive
TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
HTTP请求格式
当浏览器向Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息,HTTP请求信息由3部分组成:
- 请求方法URI协议/版本
- 请求头(Request Header)
- 请求正文
下面是一个HTTP请求的例子:
GET/sample.jspHTTP/1.1
Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate
username=jinqiao&password=1234
解读:
1.1 请求方法URI协议/版本
GET/sample.jsp HTTP/1.1
-
以上代码中“GET”代表请求方法,“/sample.jsp”表示URI,“HTTP/1.1代表协议和协议的版本。
-
根据HTTP标准,HTTP请求可以使用多种请求方法。例如:HTTP1.1支持7种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TARCE。在Internet应用中,最常用的方法是GET和POST。
-
URL完整地指定了要访问的网络资源,通常只要给出相对于服务器的根目录的相对目录即可,因此总是以“/”开头
-
最后,协议版本声明了通信过程中使用HTTP的版本。
1.2 请求头(Request Header)
-
请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。
-
Accept:image/gif.image/jpeg./
-
Accept-Language:zh-cn
-
Connection:Keep-Alive
-
Host:localhost
-
User-Agent:Mozila/4.0(compatible:MSIE5.01:Windows NT5.0)
-
Accept-Encoding:gzip,deflate.
1.3 请求正文
- 请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:
username=jinqiao&password=1234
在以上的例子的HTTP请求中,请求的正文只有一行内容。当然,在实际应用中,HTTP请求正文可以包含更多的内容。
HTTP请求方法之get ,post
一. 向网页发送数据
1. get(带参数的:params)
- 键值对的形式传递参数
payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
r = requests.get('http://httpbin.org/get', params=payload)
2. post(带参数的:data)
post与get方法都类似,只不过不是params=...而是data=...
传递表单
payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.post("http://httpbin.org/post", data=payload)
传递文件 (files)
url = 'http://httpbin.org/post'
files = {'file': open('report.xls', 'rb')}
r = requests.post(url, files=files)
3. Requests库的七个方法以及13个参数
- requests.request():构造一个请求,支撑一下各方法的基础方法
- requests.get():获取HTML网页的主要方法,对应HTTP的GET
- requests.head():获取HTML网页头的信息方法,对应HTTP的HEAD
- requests.post():向HTML网页提交POST请求方法,对应HTTP的POST
- requests.put():向HTML网页提交PUT请求的方法,对应HTTP的RUT
- requests.patch():向HTML网页提交局部修改请求,对应于HTTP的PATCH
- requests.delete():向HTML页面提交删除请求,对应HTTP的DELETE
- HTTP协议:
- HTTP,Hypertext Transfer Protocol,超文本传输协议。
- HTTP是一个基于“请求与响应”模式的,无状态的应用层协议。
- HTTP协议采用URL作为定位网络资源的标识。
- URL格式:http://host[:port][path]
- host:合法的Internet主机域名或IP地址
- port:端口号,缺省端口为80
- path:请求资源的路径
- URL是通过HTTP协议存取资源的Internet路径,一个URL对应一个数据资源。
- 十三个参数
requests.request(method,url,**kwargs)
- method:请求方式,对应get/put/post等7种
- url:拟获取页面的url链接
- **kwargs:控制访问参数,共13个
- **kwargs:控制访问的参数,均为可选项:
====
十三个参数包括:
- params:字典或字节序列,作为参数增加到url中
- data:字典,字节序列或文件对象,作为Request的内容
- json:JSON格式的数据,作为Request的内容
- headers:字典,HTTP定制头(模拟浏览器进行访问)
- cokies:字典或CpplieJar,Request中的cookie
- auth:元祖,支持HTTP认证功能
- files:字典类型,传输文件
- timeout:设定超时时间,秒为单位
- proxies:字典类型,设定访问代理服务器,可以增加登陆认证
- allow_redirects:True//False,默认为True,重定向开关
- stream:True/False,默认为True,获取内容立即下载开关
- verify:True/False,默认为True,认证SSL证书开关
- cert:本地SSL证书路径"""
例:
kv={'key1':'value','key2':'value2'}
r=requests.request('GET','http://python123.io/ws',params=kv)
print(r.url)
输出结果:
http://python.io/ws?key1=value1&key2=value2