zoukankan      html  css  js  c++  java
  • 粘包 拆包(分包) 半包

    粘包、拆包、半包理解

    TCP是一种面向流的网络层传输协议,在使用TCP作为传输层协议时,可保证数据的顺序性和可靠性。

    应用层在使用TCP协议传输数据时,可采取两种方式:

    • 短链接:客户端同服务端完成一次通信(客户端只发送一次请求,并接收到响应),关闭TCP连接;
    • 长连接:客户端持续同服务端进行通信(客户端不停的发送请求,并接收到响应),不关闭TCP连接;

    使用短连接时,可通过TCP连接是否关闭判断是否完成了一次请求响应通信。但每次请求必须重建TCP连接,会导致请求响应一会会存在一个TCP握手延时。因此经常使用长连接进行较高频率的请求响应通信。

    但在使用长连接时,由于客户端可能会发送多个请求,服务端会同时持续收到数据。服务端接收到的数据中可能包含多个请求数据,此时请求数据是粘连在一起的(粘包),需要进行拆分(拆包)。

    还有一种情况,服务端接收到的数据中包含一个不完整的请求数据,剩余数据还未接收到(半包),服务端需要继续接收数据直到接收完整请求数据。

    • 粘包:只会在长连接通信方式中存在,不同的请求数据会被服务端同时接收到,而服务端暂时无法将其请求数据区分为请求1或者请求2。
    • 拆包:将粘连在一起的不同请求数据进行拆分
    • 半包:服务端接收到的请求数据不完整,剩余数据正在传输过程中。

    粘包、拆包、半包图示

    粘包:服务端接收到的请求数据紧紧挨着,暂时无法分离。

    拆包:服务端将接收到的数据拆分为不同的请求数据

    半包:拆包过程中发现某个请求数据不完整,需要继续接收数据。

    如何拆包、判断半包

    如何判断不同请求数据的起始和结束位置,是拆包和判断半包的关键。

    常用的方法有两种:

    • 包头(包含包体长度)+包体
    • 包头(包含预定义的界定标识)+包体+包尾(包含预定义的界定标识)

    第一种方法,读取固定长度的包头后,可根据包头中指定的包体长度读取包体,直到读取到完整的包体。

    • 问题:如果包头中的包体长度同实际的包体长度不附,会导致后续的所有数据拆包都出现问题,且无法恢复。

    第二种方法,在持续读取数据时,需要判断读取的数据中是否出现了界定标识,出现了即可判断是否已到旧包的包尾或者新包的包头。包头和包尾至少存在一个。

    • 问题:读取过程中需一直判断界定标识,在高速传输数据时,会导致微小的处理延时。

    http协议可以说是以上两种方法的结合,http header信息通过第二种方法获取,两个CRLF后标识http header结束,http response body通过第一种方法获取(content-length),也会采用第一二种结合方式获取(transfer-Encoding: chunked)。

  • 相关阅读:
    Python---列表相关操作
    PyCharm使用小技巧--git上传代码至远程仓库
    Linux下修改文件权限
    Linux运行jmeter
    Jmeter添加负载机
    git使用
    Linux之12——常用统计命令之uniq
    Linux之11——常用统计命令之sort
    Linux之10——dd命令详解
    Linux之8——性能调优之iostat命令详解
  • 原文地址:https://www.cnblogs.com/mahuan2/p/7988530.html
Copyright © 2011-2022 走看看