zoukankan      html  css  js  c++  java
  • 5分钟让你明白HTTP协议

    一、HTTP简介

    1.http协议介绍

    1. HTTP协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准。
    2. HTTP是基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)
    3. HTTP协议通常承载于TCP协议之上,有时也承载于TLS或SSL协议层之上,这个时候,就成了我们常说的HTTPS。如下图 http/https
    4. HTTP是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型。HTTP是一个无状态的协议。
    5. HTTP默认的端口号为80,HTTPS的端口号为443。

    2.http协议工作流程

    一次HTTP操作称为一个事务,其工作过程大概如下:

    1. 用户在浏览器中键入需要访问网页的URL或者点击某个网页中链接;
    2. 浏览器根据URL中的域名,通过DNS解析出目标网页的IP地址;
    浏览器请求这个页面:http://hackr.ip/index.html
    在这一步,需要域名系统DNS解析域名hackr.ip,得主机的IP地址 20X.189.105.112。
    然后将上面结合本机自己的信息,封装成一个http请求数据包
    
    1. 在HTTP开始工作前,客户端首先会通过TCP/IP协议来和服务端建立链接(TCP三次握手)
    2. 建立连接后,客户机发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可内容。
    3. 服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。
    4. 一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码: Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。 http链接步骤
    http协议和tcp协议

    2.1 短连接

    短连接的操作步骤是: 建立连接——数据传输——关闭连接...建立连接——数据传输——关闭连接

    如果客户请求频繁,将在TCP的建立和关闭操作上浪费较多时间和带宽。

    短连接

    2.2 长链接

    长链接,指在一个连接上可以连续发送多个数据包,在连接保持期间,如果没有数据包发送,需要双方发链路检测包。

    长链接操作步骤: 建立连接——数据传输...(保持连接)...数据传输——关闭连接

    长连接可以省去较多的TCP建立和关闭的操作,减少浪费,节约时间

    长链接分为 without pipelining 和 with pipelining,下图中是without pipelining,客户端只在收到前一个请求的响应后,才发出新的请求。

    长链接

    2.3 管线化

    下图是with pipelining,每次建立链接后无需等待请求回来就可以发送下一个请求

    管线化

    3. Http请求报文

    客户端发送一个HTTP请求到服务器的请求消息包括以下格式:

    请求行(request line)、请求头部(header)、请求体组成,下图给出了请求报文的一般格式。

    HTTP请求
    请求行:
        方法:
            GET 获取资源
            POST 向服务器端发送数据,传输实体主体
            PUT 传输文件
            HEAD 获取报文首部
            DELETE 删除文件
            OPTIONS 询问支持的方法
            TRACE 追踪路径
        协议/版本号
        URL
        
    请求头:
        通用首部(General Header)
        请求首部(Request Header)
        响应首部(Response Header)
        实体首部(Entity Header Fields)
        
    请求体
    

    请求报文拆解:

    http请求报文

    3.1 get请求

    get请求

    3.2 post请求

    post请求

    4. Http响应报文

    HTTP响应组成:响应行、响应头、响应体。

    http响应
    响应行
        (HTTP/1.1)表明HTTP版本为1.1版本,状态码为200,状态消息为(ok)
    响应头
        Date:生成响应的日期和时间;
        Content-Type:指定了MIME类型的HTML(text/html),编码类型是ISO-8859-1
    响应体
    

    响应报文拆解:

    http响应报文

    5. Http状态码

    类别原因
    1XX Informational(信息性状态码)
    2XX Success(成功状态码)
    3XX Redirection(重定向)
    4XX Client Error(客户端错误状态码)
    5XX Server Error(服务器错误状态吗)

    5.1 2XX 成功

    200(OK 客户端发过来的数据被正常处理
    204(Not Content 正常响应,没有实体
    206(Partial Content 范围请求,返回部分数据,响应报文中由Content-Range指定实体内容
    

    5.2 3XX 重定向

    301(Moved Permanently) 永久重定向
    302(Found) 临时重定向,规范要求,方法名不变,但是都会改变
    303(See Other) 和302类似,但必须用GET方法
    304(Not Modified) 状态未改变, 配合(If-Match、If-Modified-Since、If-None_Match、If-Range、If-Unmodified-Since)
    307(Temporary Redirect) 临时重定向,不该改变请求方法
    

    5.3 4XX 客户端错误

    400(Bad Request) 请求报文语法错误
    401 (unauthorized) 需要认证
    403(Forbidden) 服务器拒绝访问对应的资源
    404(Not Found) 服务器上无法找到资源
    

    5.4 5XX 服务器端错误

    500(Internal Server Error)服务器故障
    503(Service Unavailable) 服务器处于超负载或正在停机维护
    

    6. 首部

    6.1 通用首部字段

    首部字段名说明
    Cache-Control 控制缓存行为
    Connection 链接的管理
    Date 报文日期
    Pragma 报文指令
    Trailer 报文尾部的首部
    Trasfer-Encoding 指定报文主体的传输编码方式
    Upgrade 升级为其他协议
    Via 代理服务器信息
    Warning 错误通知

    6.2 请求首部字段

    首部字段名说明
    Accept 用户代理可处理的媒体类型
    Accept-Charset 优先的字符集
    Accept-Encoding 优先的编码
    Accept-Langulage 优先的语言
    Authorization Web认证信息
    Expect 期待服务器的特定行为
    From 用户的电子邮箱地址
    Host 请求资源所在的服务器
    If-Match 比较实体标记
    If-Modified-Since 比较资源的更新时间
    If-None-Match 比较实体标记
    If-Range 资源未更新时发送实体Byte的范围请求
    If-Unmodified-Since 比较资源的更新时间(和If-Modified-Since相反)
    Max-Forwards 最大传输跳数
    Proxy-Authorization 代理服务器需要客户端认证
    Range 实体字节范围请求
    Referer 请求中的URI的原始获取方
    TE 传输编码的优先级
    User-Agent HTTP客户端程序的信息

    6.3 响应首部字段

    首部字段名说明
    Accept-Ranges 是否接受字节范围
    Age 资源的创建时间
    ETag 资源的匹配信息
    Location 客户端重定向至指定的URI
    Proxy-Authenticate 代理服务器对客户端的认证信息
    Retry-After 再次发送请求的时机
    Server 服务器的信息
    Vary 代理服务器缓存的管理信息
    www-Authenticate 服务器对客户端的认证

    6.4 实体首部字段

    首部字段名说明
    Allow 资源可支持的HTTP方法
    Content-Encoding 实体的编码方式
    Content-Language 实体的自然语言
    Content-Length 实体的内容大小(字节为单位)
    Content-Location 替代对应资源的URI
    Content-MD5 实体的报文摘要
    Content-Range 实体的位置范围
    Content-Type 实体主体的媒体类型
    Expires 实体过期时间
    Last-Modified 资源的最后修改时间

    参考:

    1. HTTP简介
    2. HTTP协议详解
    3. HTTP
    4. HTTP工作过程



  • 相关阅读:
    Java虚拟机JVM学习01 流程概述
    Java虚拟机JVM学习02 类的加载概述
    Java虚拟机JVM学习03 连接过程:验证、准备、解析
    Java虚拟机JVM学习04 类的初始化
    代码块(1)
    AtomicInteger
    简单的爬信息
    String.valueOf(null) 报空指针
    图片预览上传
    护城河
  • 原文地址:https://www.cnblogs.com/cangqinglang/p/8969544.html
Copyright © 2011-2022 走看看