HTTP
1. 概述:
客户端和服务器通过相互交换各自的消息(与数据流相反)进行交互,客户端发送的消息叫做request,被服务器响应的叫做responses
补充:
1.客户端-服务器模型:
是一种分布式的应用程序结构,客户端和服务器通常通过计算机网络在单独的硬件上进行通信,但客户端个服务器可能位于同一系统中。因此,客户端启动与等待传入请求的服务器的通信会话。使用客户端 - 服务器模型的计算机应用程序的示例是电子邮件,网络打印和万维网。
-
无状态保存
无状态设计简化了服务器设计,因为无需动态分配存储来处理正在进行的对话。如果客户端会话在事务中期死亡,则系统的任何部分都不需要负责清理服务器的当前状态。无状态的缺点是可能需要在每个请求中包含附加信息,并且这些额外信息需要由服务器解释。
2.基于HTTP的组件系统
写在前边的生疏的概念:
-
HTTP请求的代理是什么?
HTTP代理本质上是一个Web应用,它和其他普通Web应用没有根本区别。HTTP代理收到请求后,根据Header中Host字段的主机名和Get/POST请求地址综合判断目标主机,建立新的HTTP请求并转发请求数据,并将收到的响应数据转发给客户端。
-
代理主要有如下几种作用:
-
缓存(可以是公开的也可以是私有的,像浏览器的缓存)
-
过滤(像反病毒扫描,家长控制...)
-
负载均衡(让多个服务器服务不同的请求)
-
认证(对不同资源进行权限管理)
-
日志记录(允许存储历史信息)
-
-
基于HTTP的组件系统?
上边已经说到HTTP请求是一个客户端-服务器模型协议:请求通过一个实体被发出,这里的实体就是代理,大多数情况下代理指的是浏览器,它可以是任何东西,比如一个爬虫程序。
每一个发送到服务器的请求,都会被服务器处理并返回一个消息,也就是response。在这个请求与响应之间,还有许许多多的被称为proxies的实体,他们的作用与表现各不相同,比如有些是网关,还有些是caches等。
实际上,在一个浏览器和处理请求的服务器之间,还有路由器、调制解调器等许多计算机。由于Web的层次设计,那些在网络层和传输层的细节都被隐藏起来了。HTTP位于最上层的应用层。虽然底层对于分析网络问题非常重要,但是大多都跟对HTTP的描述不相干。
3.HTTP的基本性质
-
HTTP是简单的
-
HTTP是可扩展的
-
HTTP是无状态,有会话的
-
HTTP是无状态的:在同一个连接中,两个执行成功的请求之间是没有关系的。这就带来了一个问题,用户没有办法在同一个网站中进行连续的交互,比如在一个电商网站里,用户把某个商品加入到购物车,切换一个页面后再次添加了商品,这两次添加商品的请求之间没有关联,浏览器无法知道用户最终选择了哪些商品。而使用HTTP的头部扩展,HTTP Cookies就可以解决这个问题。把Cookies添加到头部中,创建一个会话让每次请求都能共享相同的上下文信息,达成相同的状态。
注意,HTTP本质是无状态的,使用Cookies可以创建有状态的会话。
-
4.是基于请求响应的
5.基于TCP/IP
6.无连接
-
无连接的含义是限制每次连接只处理一个请求。服务器处理完客户端的请求,并收到客户端的应答后,即断开连接。采用这种方式可以节省传输时间。
-
补充:HTTP和连接
一个连接是由传输层来控制的,这从根本上不属于HTTP的范围。HTTP并不需要其底层的传输层协议是面向连接的,只需要它是可靠的,或不丢失消息的(至少返回错误)。在互联网中,有两个最常用的传输层协议:TCP是可靠的,而UDP不是。因此,HTTP依赖于面向连接的TCP进行消息传递,但连接并不是必须的。
HTTP/1.0为每一个请求/响应都打开一个TCP连接,导致了2个缺点:打开一个TCP连接需要多次往返消息传递,因此速度慢。但当多个消息周期性发送时,这样就变得更加高效:暖连接比冷连接更高效。
为了减轻这些缺陷,HTTP/1.1引入了流水线(被证明难以实现)和持久连接的概念:底层的TCP连接可以通过Connection
头部来被部分控制。HTTP/2则发展得更远,通过在一个连接复用消息的方式来让这个连接始终保持为暖连接。
为了更好的适合HTTP,设计一种更好传输协议的进程一直在进行。Google就研发了一种以UDP为基础,能提供更可靠更高效的传输协议QUIC