zoukankan      html  css  js  c++  java
  • HTTP 协议详解

    前言:

      之前买过一本《图解 HTTP》这本书,作者好像是个小日本,也继承了小日本在动漫方面的天赋,30% 的内容都是 Q 版画图。
      之后没有引起我的重视,书一借出去,然后,之后 .. 之后,就没有了之后了。
     
      先简单了解一下 Web 相关的知识,现在市面上所有的浏览器以及服务器都是采用的 HTTP 1.1 版本,HTTP 2.0 很快也要普及了。
      其实很多浏览器已经支持到 2.0 了。https://www.zhihu.com/question/34074946
     
    一、HTTP 协议基础
         Web 使用一种超文本传输(无状态?)协议作为规范,完成客户端等一系列的运作流程。而协议是指流程的规定。可以说,Web 是建立在 HTTP 协议上通信的。
         在计算机通信中,HTTP 协议属于应用层,传输层还是采用的 TCP/IP 来实现,在这个基础上,还需要了解一下知识就是 DNS。
         粗暴了模拟一个在浏览器中输入一个 www.baidu.com 所有经过的事情:
         1、浏览器获取到用户在地址栏输入的域名后,浏览器将本机基本信息、浏览器基本信息等组成 HTTP 请求包;
         2、浏览器将 HTTP 请求包,请求到目标域名,操作系统网络通信模块将域名转换为 IP 地址;(Windows、DNS)
         3、Web 服务器获取到客户端请求的信息后(与服务器的网络层通讯跳过),做出相应的操作后返回客户端一组数据(HTTP 标准数据)
         4、浏览器开始解析 Web 服务器响应的 HTTP 响应内容包,将内容部分(符合 W3C 规范)解析并渲染成用户看到的效果;
         
     HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:
      (1)建立TCP连接
        在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,
        该协议与IP协议共同构建Internet,即著名的 TCP/IP 协议族,因此Internet又被称作是TCP/IP网络。
        HTTP是比TCP更高层次的应用层协议,根据规则,只有低层协议建立之后才能,才能进行更层协议的连接,
        因此,首先要建立TCP连接,一般TCP连接的端口号是 80
      (2)Web浏览器向Web服务器发送请求命令
        一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令
        例如:GET/sample/hello.jsp HTTP/1.1
      (3)Web浏览器发送请求头信息
        浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,
        之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。
      (4)Web服务器应答
        客户机向服务器发出请求后,服务器会客户机回送应答,
        HTTP/1.1 200 OK
        应答的第一部分是协议的版本号和应答状态码
      (5)Web服务器发送应答头信息
        正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。
      (6)Web服务器向浏览器发送数据
        Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,
        接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据
      (7)Web服务器关闭TCP连接
        一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码
        Connection:keep-alive
        TCP 连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。
        保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
     
    二、HTTP Request
              
      HTTP请求格式
      当浏览器向Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息,HTTP请求信息由3部分组成:
      l   请求方法URI协议/版本
      l   请求头(Request Header)
      l   请求正文
      下面是一个HTTP请求的例子:
      [ 请求方法URI协议/版本 ]
           GET/sample.jspHTTP/1.1
      [ 请求头 ]
           Accept:image/gif.image/jpeg,*/*
           Accept-Language:zh-cn
           Connection:Keep-Alive
           Host:localhost
           User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
           Accept-Encoding:gzip,deflate
      [ 请求正文 ]
        username=jinqiao&password=1234
     
    三、HTTP Reponse
     
      HTTP应答与HTTP请求相似,HTTP响应也由3个部分构成,分别是:
      l 协议状态版本代码描述
      l 响应头(Response Header)
      l 响应正文
      下面是一个HTTP响应的例子:
      [ 协议状态版本代码描述 ]
        HTTP/1.1 200 OK
      [ 响应头 ]
        Server:Apache Tomcat/5.0.12
        Date:Mon,6Oct2003 13:23:42 GMT
        Content-Length:112
      [ 响应正文 ]
      <html>
        <head>
          <title>HTTP响应示例<title>
        </head>
        <body>
          Hello HTTP!
        </body>
      </html>
     
      常见 HTTP 状态码:
      HTTP Reponse Code:
        301     永久重定向,一般作用于 baidu.com -> www.baidu.com
        302    临时重定向,跳转了新的 URI 地址,SEO 友好度差
        400   响应内容错误,浏览器无法解析响应体的内容
        403   请求的内容被服务拒绝,可能存在权限问题
        404   服务器上未找到改链接指向的地址
        500   服务器执行请求时发生了错误
        503   服务器超负债或,简称挂了
     

    HTTP Request Header 请求头

    Header解释示例
    Accept 指定客户端能够接收的内容类型 Accept: text/plain, text/html
    Accept-Charset 浏览器可以接受的字符编码集。 Accept-Charset: iso-8859-5
    Accept-Encoding 指定浏览器可以支持的web服务器返回内容压缩编码类型。 Accept-Encoding: compress, gzip
    Accept-Language 浏览器可接受的语言 Accept-Language: en,zh
    Accept-Ranges 可以请求网页实体的一个或者多个子范围字段 Accept-Ranges: bytes
    Authorization HTTP授权的授权证书 Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
    Cache-Control 指定请求和响应遵循的缓存机制 Cache-Control: no-cache
    Connection 表示是否需要持久连接。(HTTP 1.1默认进行持久连接) Connection: close
    Cookie HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。 Cookie: $Version=1; Skin=new;
    Content-Length 请求的内容长度 Content-Length: 348
    Content-Type 请求的与实体对应的MIME信息 Content-Type: application/x-www-form-urlencoded
    Date 请求发送的日期和时间 Date: Tue, 15 Nov 2010 08:12:31 GMT
    Expect 请求的特定的服务器行为 Expect: 100-continue
    From 发出请求的用户的Email From: user@email.com
    Host 指定请求的服务器的域名和端口号 Host: www.zcmhi.com
    If-Match 只有请求内容与实体相匹配才有效 If-Match: “737060cd8c284d8af7ad3082f209582d”
    If-Modified-Since 如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码 If-Modified-Since: Sat, 29 Oct 2010 19:43:31 GMT
    If-None-Match 如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变 If-None-Match: “737060cd8c284d8af7ad3082f209582d”
    If-Range 如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为Etag If-Range: “737060cd8c284d8af7ad3082f209582d”
    If-Unmodified-Since 只在实体在指定时间之后未被修改才请求成功 If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT
    Max-Forwards 限制信息通过代理和网关传送的时间 Max-Forwards: 10
    Pragma 用来包含实现特定的指令 Pragma: no-cache
    Proxy-Authorization 连接到代理的授权证书 Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
    Range 只请求实体的一部分,指定范围 Range: bytes=500-999
    Referer 先前网页的地址,当前请求网页紧随其后,即来路 Referer: http://www.zcmhi.com/archives/71.html
    TE 客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息 TE: trailers,deflate;q=0.5
    Upgrade 向服务器指定某种传输协议以便服务器进行转换(如果支持) Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
    User-Agent User-Agent的内容包含发出请求的用户信息 User-Agent: Mozilla/5.0 (Linux; X11)
    Via 通知中间网关或代理服务器地址,通信协议 Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
    Warning 关于消息实体的警告信息 Warn: 199 Miscellaneous warning
     

    HTTP Responses Header 响应头

    Header解释示例
    Accept-Ranges 表明服务器是否支持指定范围请求及哪种类型的分段请求 Accept-Ranges: bytes
    Age 从原始服务器到代理缓存形成的估算时间(以秒计,非负) Age: 12
    Allow 对某网络资源的有效的请求行为,不允许则返回405 Allow: GET, HEAD
    Cache-Control 告诉所有的缓存机制是否可以缓存及哪种类型 Cache-Control: no-cache
    Content-Encoding web服务器支持的返回内容压缩编码类型。 Content-Encoding: gzip
    Content-Language 响应体的语言 Content-Language: en,zh
    Content-Length 响应体的长度 Content-Length: 348
    Content-Location 请求资源可替代的备用的另一地址 Content-Location: /index.htm
    Content-MD5 返回资源的MD5校验值 Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
    Content-Range 在整个返回体中本部分的字节位置 Content-Range: bytes 21010-47021/47022
    Content-Type 返回内容的MIME类型 Content-Type: text/html; charset=utf-8
    Date 原始服务器消息发出的时间 Date: Tue, 15 Nov 2010 08:12:31 GMT
    ETag 请求变量的实体标签的当前值 ETag: “737060cd8c284d8af7ad3082f209582d”
    Expires 响应过期的日期和时间 Expires: Thu, 01 Dec 2010 16:00:00 GMT
    Last-Modified 请求资源的最后修改时间 Last-Modified: Tue, 15 Nov 2010 12:45:26 GMT
    Location 用来重定向接收方到非请求URL的位置来完成请求或标识新的资源 Location: http://www.zcmhi.com/archives/94.html
    Pragma 包括实现特定的指令,它可应用到响应链上的任何接收方 Pragma: no-cache
    Proxy-Authenticate 它指出认证方案和可应用到代理的该URL上的参数 Proxy-Authenticate: Basic
    refresh 应用于重定向或一个新的资源被创造,在5秒之后重定向(由网景提出,被大部分浏览器支持)
     
    Refresh: 5; url=
    http://www.zcmhi.com/archives/94.html
    Retry-After 如果实体暂时不可取,通知客户端在指定时间之后再次尝试 Retry-After: 120
    Server web服务器软件名称 Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
    Set-Cookie 设置Http Cookie Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
    Trailer 指出头域在分块传输编码的尾部存在 Trailer: Max-Forwards
    Transfer-Encoding 文件传输编码 Transfer-Encoding:chunked
    Vary 告诉下游代理是使用缓存响应还是从原始服务器请求 Vary: *
    Via 告知代理客户端响应是通过哪里发送的 Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
    Warning 警告实体可能存在的问题 Warning: 199 Miscellaneous warning
    WWW-Authenticate 表明客户端请求实体应该使用的授权方案 WWW-Authenticate: Basic
     
     
    部分内容转载自:
     
  • 相关阅读:
    推荐一个采用方便程序员在线动画学习常用算法的良心网站
    你的ABAP程序给佛祖开过光么?来试试Jerry这个小技巧
    我在德国做SAP CRM One Order redesign工作的心得
    我做SAP CRM One Order redesign的一些心得体会
    一个最简单的WebSocket hello world demo
    推荐一个好用的以多tab标签方式打开windows CMD的工具
    SAP CX Upscale Commerce : SAP全新推出的电商云平台
    TCP socket和web socket的区别
    SAP 前端技术的演化史简介
    Fiori Fundamentals和SAP UI5 Web Components
  • 原文地址:https://www.cnblogs.com/loongsoft/p/7274040.html
Copyright © 2011-2022 走看看