zoukankan      html  css  js  c++  java
  • HTTP 协议解析

    目录

    HTTP 协议

    HTTP(Hyper Text Transfer Protocol 超文本传输协议), 是基于 TCP/IP 通信协议来实现数据传递的应用层协议. 用于 www 万维网服务器(Server-Side)本地浏览器(Client-Side) 之间传输超文本的传输协议.

    这里写图片描述

    又因为 TCP/IP 协议是一个端到端的面向连接的协议, 所谓的端到端可以理解为进程到进程之间的连接, 所以 HTTP 协议在开始传输数据之前, 首先需要建立一个 TCP 连接, 而 TCP 连接的过程需要 三次握手. 在 TCP 三次握手之后, 成功建立了 TCP 连接, 此后 HTTP 协议就可以进行数据传输了.

    这里写图片描述

    HTTP 协议工作原理

    • Step 1: Client-Side 与 Server-Side 建立一个 TCP 套接字连接.
    • Step 2:Client-Side 通过 TCP 套接字向 Sever-Side 发送 HTTP Request(请求报文).
    • Step 3: Server-Side 接收并解析 HTTP Request 之后执行事物并返回 HTTP Response.
    • Step 4: 释放 TCP 连接, 若 connection mode 为 close, 则 Server-Side 主动关闭 TCP 连接, Client-Side 被动关闭连接, 最后释放 TCP 连接. 若 connection mode 为 keepalive, 则该连接会保持一段时间, 在该时间内 Server-Side 可以继续接收请求.

    HTTP Request

    HTTP Request 请求行 + Request_Header + Body 组成:
    这里写图片描述

    请求行

    用于说明请求类型, 要访问的资源以及所使用的HTTP版本.
    格式: Method Request-URI HTTP-Version <CR><LF>

    • Method: HTTP Method
    • Request-URI: 统一资源标识符
    • HTTP-Version: 表示请求的HTTP协议版本
    • : 表示回车和换行符( ), 请求行必须由换行符结尾

    其中 HTTP Method 有下列几种类型:

    • GET: (获取) 请求获取 Request-URI 标识的资源
    • POST: (创建) 请求在 Request-URI 标识的资源添加新的数据
    • PUT: (更新) 请求向 Request-URI 标识的资源上传其最新内容
    • DELETE: (删除) 请求删除 Request-URI 标识的资源
    • HEAD: 请求获取 Request-URI 标识的资源的 Response-Header
    • TRACE: 请求服务器回送请求信息, 一般用于测试或诊断
    • OPTIONS: 请求获取服务器的性能参数, 或者查询与资源相关的选项
    • CONNECT: 保留将来使用

    因为这些 HTTP 协议提供了多种 Method, 所以 HTTP 协议除了作为传输协议之外, 还被作为应用协议.

    Request Header

    Request Header(请求报头) 是 HTTP Header 的其中一种类型, 用于指定服务器接受的附加信息, 由由若干个请求报头域键值对组成, 报头域的格式为 报头域名: 值 . 下面列出常用的请求报头域:

    • Host: 指定服务器的主机和端口号信息, 发送请求时, 该请求报头域是必需的

    • Authorization: 请求服务器鉴权, 如果服务器的响应代码为 401 未授权, 那么可以发送一个含有 Authorization 请求报头域的请求, 要求服务器对客户端进行鉴权验证.

    • Accept: 指定客户端接受的响应信息数据类型, E.G. 'Accept': 'application/json' 指定接受 JSON 格式数据

    • Accept-Charset: 指定客户端接受的响应信息字符集类型, E.G. Accept-Charset:iso-8859-1,gb2312,utf8

    • Accept-Encoding: 指定客户端接受的内容压缩类型, E.G. Accept-Encoding:gzip.deflate

    • Accept-Language: 指定客户端接受的自然语言类型, E.G. eg:Accept-Language:zh-cn

    • User-Agent: 将客户端操作系统、浏览器和其它本地属性传入服务器

    • Cache-Control:指定请求和响应遵循的缓存机制

    • Connection: 指定 TCP 连接模式

    • Cookie: 最重要的请求头之一, 将 cookie 发送给服务器

    EXAMPLE:

    GET /562f25980001b1b106000338.jpg HTTP/1.1
    Host    img.mukewang.com
    User-Agent    Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
    Accept    image/webp,image/*,*/*;q=0.8
    Referer    http://www.imooc.com/
    Accept-Encoding    gzip, deflate, sdch
    Accept-Language    zh-CN,zh;q=0.8

    HTTP Response

    HTTP Response 由 状态行 + Response_Header + Body 组成:

    状态行

    格式: HTTP-Version Status-Code Reason-Phrase <CR><LF>

    • HTTP-Version: 服务器 HTTP 协议版本
    • Status-Code: 服务器发回的响应状态码
    • Reason-Phrase: 状态码的文本描述
    • : 状态行也必须以换行符结尾

    其中由服务器响应的状态码分为 5 大类型:

    • 1xx: (指示信息) 表示请求已接收,继续处理
    • 2xx: (成功) 表示请求已被成功接收、理解、接受
    • 3xx: (重定向) 要完成请求必须进行更进一步的操作
    • 4xx: (客户端错误) 请求有语法错误或请求无法实现
    • 5xx: (服务器端错误) 服务器未能实现合法的请求

    更多状态码

    Response Header

    用来指定客户端接收的的附加信息.

    • Server: 包含了服务器处理请求的软件环境信息

    • Allow: 服务器支持哪些 HTTP Method

    • Set-Cookie:最重要的响应报头域之一, 用于把 cookie 发送到客户端, 每一个写入 cookie 都会生成一个 Set-Cookie, E.G. Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com

    • Location: 用于重定向到一个新的位置, 包含新的URL地址

    EXAMPLE 1:
    这里写图片描述

    EXAMPLE 2:

    HTTP/1.0 200 OK 
    Content-Type: text/plain
    Content-Length: 137582
    Expires: Thu, 05 Dec 1997 16:00:00 GMT
    Last-Modified: Wed, 5 August 1996 15:55:28 GMT
    Server: Apache 0.84
    
    <html>
      <body>Hello World</body>
    </html>

    Body

    在客户端发送 Request 或服务器响应 Response 时都可以传输一个 Body(实体), 其由 实体报头域 + 实体正文[可选]组成, 其中实体报头域用于定义了实体正文. 常用的实体报头域有下列几种类型:

    • Content-Type: 指定了发送给接收者的实体正文的媒体格式类型(MIME type), E.G. 'Content-Type': 'application/json'/Content-Type:text/html;charset=GB2312
    • Content-Length: 指定了实体正文的长度, 以十进制数字表示

    • Content-Encoding: 指定了附加在实体正文上的附加内容的压缩类型, E.G. Content-Encoding:gzip

    • Content-Language: 描述了资源所使用的自然语言

    • Expires: 指定了响应过期的日期和时间, 以此更新缓存数据, E.G. Expires:Thu,15 Sep 2006 16:23:12 GMT

    • Last-Modified: 描述了资源的最后修改日期和时间

    NOTE: 因为无论 Request 或者 Response 都可能发送 Body, 所以上述的实体报头域是通用的.

  • 相关阅读:
    PHP 获取请求里的 header字段以及发送header
    宝塔链接数据库
    链表中头结点和头指针
    git How to resolve a Git “CONFLICT (modify/delete)”?
    yii 执行mysql:既要添加数据又要更新数据
    recv() failed (104: Connection reset by peer) while reading response header from upstream
    Linux磁盘空间满了,定位到mysql日志,删除
    mysql 字符乱码
    php message queue
    CGI 、fastcgi、php-cgi、php-fpm
  • 原文地址:https://www.cnblogs.com/jmilkfan-fanguiju/p/10589831.html
Copyright © 2011-2022 走看看