HTTP协议
下面会讲:
- HTTP协议的主要特点
- HTTP报文的组成部分
- HTTP方法
- POST和GET的区别
- HTTP状态码
- 什么时持久连接
- 什么时管线化
1.HTTP协议的主要特点
- 简单快速
- 灵活
- 无状态
- 无连接
- 支持客户/服务器模式:可以连接客户端和服务端;
简单快速: 每个资源URI都是固定的,一个页面地址一张图片叫做统一资源符,这个是固定的, 所以在http协议中处理也是非常简单的。我想访问某一个地址,只要输入这个URI就可以了;
灵活: 在http协议中有一个头部分会有一个数据类型,通过一个http协议就可以完成不同数据类型的传输。
无状态: 客户端与服务端进行第二次连接,是没法区分上一次连接和这一次连接是不是同一个身份(来源地址,比如账号)。因为服务端是没有记住你的状态的。无法记住上一次请求。
无连接: 连接一次它就会断掉,不会保持连接;
怎么解决无状态和无连接?
无状态: HTTP 协议本身无法解决这个状态,只有通过 cookie 和 session 将状态做贮存,常见的场景是登录状态保持;
无连接: 可以通过自身属性 Keep-Alive。
2.HTTP报文的组成部分
一个HTTP请求报文由四个部分组成:请求行、请求头部、空行、请求数据(请求体)。
请求是客户端(用户)发起的,回应是服务端收到客户端的请求响应给客户端的信息,有请求就有回应。
请求报文
请求行 | http方法、页面地址、http协议、版本,比如 GET /data/info.html HTTP/1.1 |
---|---|
请求头 | 如key(Accept-Language)、value(zh-CN)值等...来告诉服务端需要那些内容 |
空行 | 当请求头后面遇到空行就该当请求体来解析了,它的作用是通过一个空行,告诉服务器请求头部到此为止。 |
请求体 | 请求的数据,若方法字段是GET,则此项为空,没有数据,若方法字段是POST,则通常来说此处放置的就是要提交的数据 |
请求体: 比如要使用POST方法提交一个表单,其中有user字段中数据为“admin”, password字段为123456,那么这里的请求数据就是 user=admin&password=1234,使用&来连接各个字段。
get 请求方式是没有请求体(报文体)的。
HTTP(S)请求过程: 请求地址 → DNS 解析 → 三次握手 → 发送请求 → 服务响应数据 → 四次挥手断开连接
响应报文
HTTP响应报文也由四部分组成:响应行、响应头、空行、响应体。
状态行 | (HTTP/1.1 200OK--http状态码) |
---|---|
响应头 | key、value值来告诉服务端要那些内容,注意哪些类型 |
空行 | 参考上面的请求头 |
响应体 | 返回给客户端的html文档就是响应体部分 |
3.HTTP方法
GET-------------> 获取资源
POST------------> 传输资源
PUT-------------> 更新资源
DELETE----------> 删除资源(一般做业务是不删除资源的)
HEAD------------> 获取报文首部
4.POST和GET的区别
1、 GET在浏览器回退时是无害的,而POST会再次提交请求
2、 GET产生的URL地址可以被收藏,而POST不可以
3、 GET请求会被浏览器主动缓存,而POST不会,除非手动设置
4、 GET请求只能进行url编码,而POST支持多种编码方式
5、 GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留
--想把参数留在浏览器历史记录里用GET,做业务开发的时候为了防止crsf攻击,公司里都把GET请求
改成POST,如果业务需要把参数留在浏览器历史记录中记得把POST改成GET;
6、 GET请求在URL中传送的参数是有长度限制的(2kb),而POST没有限制
--如果用的是GET请求,拼接的url不要太长,否则会被浏览器截断,因为http协议对这个长度是
有限制的,发不出去,导致截断这种情况,一旦被截断,你的服务器拿不到正确的地址。
7、对参数的数据类型,GET只接受ASCII字符,而POST没有限制
8、GET比POST更不安全,因为参数直接暴露在URL上,所以不能用来传递敏感信息
9、GET参数通过URL传递,POST放在Request body中
GET 请求参数长度是由浏览器厂商规定的,不是web标准规定的。
5.HTTP状态码
1xx: 提示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收
200 OK:客户端请求成功
206 Partial Content:客户端发送了一个带有Range(范围)头的GET请求,服务器完成了它
(客户端请求一部分内容,在http head头中有一个range范围,请求0-10000字节,服务器就
返回一个206,服务器的文件是完整的,这个时候看到range头,按照range头从整个文件中截取一部分响应
给你,你响应体中只有你range头中指定的内容)
使用video播放视频地址,audio播放音频地址,当视频文件、音频文件很大的时候基本都是返回的206;
3xx:重定向--要完成请求必须进行更进一步的操作
301 Moved Permanently:(永久重定向)所请求的页面已经转移至新的url
302 Found: (临时重定向)所请求的页面已经临时转移至新的url
304 Not Modified: 客户端有缓冲的文档并发出了一个条件性的请求,服务器告诉客户,原来缓冲的文档还可以 继续使用。--服务器告诉浏览器已经有缓存了,可以直接从缓存中去取文档用,不用去服务器取了。
4xx:客户端错误--请求有语法错误或请求无法实现
400 Bad Request:客户端请求有语法错误,不能被服务器所理解;
401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用;
403 Forbidden:对被请求页面的访问被禁止;(资源禁止被访问)
--看到一个页面中一个地址,这个地址真的访问又不允许直接访问,只能通过服务器去访问;
404 Not Found:请求资源不存在;
5xx:服务器错误--服务器未能实现合法的请求
500 Internal Server Error:服务器发生不可预期的错误原来缓冲的文档还可以继续使用;
503 Server Unavailable:请求未完成,服务器临时过载或当机,一段时间后可能恢复正常;
6.HTTP持久连接
非持久连接(HTTP 1.0版本不支持): HTTP协议采用“请求--应答”模式,当使用普通模式,即非Keep-Alive(持久连接)模式时,每个请求/应答客户端和服务器都要新建一个连接,完成之后立即断开连接(HTTP协议为无连接的协议);
持久连接(1.1版本才支持): 当使用Keep-Alive模式(持久连接、连接重用)时,Keep-Alive功能使客户端到服务器端的连接持续有效,当出现对服务器的后继请求时,Keep-Alive 功能避免了建立或者重新建立连接。
7.什么是管线化
在使用持久连接的情况下,某个连接上消息的传递类似于:
--请求1-->响应1-->请求2-->响应2-->请求3-->响应3(表示整个连接没有中断过)
某个连接上的消息变成了类似这样:(持久连接情况下完成的管线化)
请求1-->请求2-->请求3-->响应1-->响应2-->响应3
管线化的特点
- 管线化机制通过持久连接完成,仅HTTP/1.1支持此技术;
- 只有GET和HEAD请求可以进行管线化,而POST则有所限制;
- 初次创建连接时不应启动管线机制,因为对方(服务器)不一定支持HTTP/1.1版本的协议;
- 管线化不会影响响应到来的顺序,如上面的例子所示,响应返回的顺序并未改变;
- HTTP/1.1要求服务器端支持管线化,但并不要求服务器端也对响应进行管线化处理,只是要求对于管线化的请求不失败即可;
- 由于上面提到的服务器端问题,开启管线化很可能并不会带来大幅度的性能提升,而且很多服务器端和代理程序对管线化的支持并不好,因此现代浏览器如 Chrome 和 Firefox 默认并未开启管线化支持;