BBR
TCP BBR(Bottleneck Bandwidth and Round-trip propagation time)是由Google设计,并于2016年发布的拥塞算法,以往大部分拥塞算法是基于丢包来作为降低传输速率的信号,而BBR基于模型主动探测。
谷歌BBR算法基于带宽实时测量的算法:记录可用带宽和通信往返时间的。
测量可用带宽值BtlBW: BBR在每次收到对方的ack时,都要实时计算传输速率,该值等于应答数据量除以应答时间。同时以10个通信往返时间为周期,将周期内测量到的最大带宽值保存在BtlBW中。
测量通信往返时间值RTprop:实时测量通信往返时间RTT,将值保存在RTprop中。如果10秒内,该值没有变化,就会在一个RTT时间内只发送4个包,通过大幅减少进入网络的数据包的方式,使测量到的RTT整体变小,进而提升后续的发送速率。
BBR的目标就是让inflight packets=BDP(带宽*物理链路延迟),就是让“网飘”的数据包个数,等于物理带宽和延迟的乘积。
如何理解呢?当前网路上传输的包数=QPS(带宽)×网路延迟,从而是网飘数据包个数最大。如QPS为100,即每秒处理100数据包,网络平均延迟为1s,则当前网络上传输的最大数据包个数为100;若网络平均延迟为0.5s,而1s单位时间处理的QPS为100,则当前网络上传输的最大数据包个数为50(前0.5s处理了50数据包,后0.5秒处理了50数据包,1s处理了100数据包即QPS为100,但1s内的每个时间点处理的数据包个数为50);若网络平均延迟为2s,2s处理了200个数据包,2s内的米格时间点处理200个数据包。
BBR算法主要处理阶段包括:
-
起步阶段
传输起步阶段,与传统算法基本一致,每次发送速率翻倍增长。不同的是,如果连续三次翻倍增长后,对比发现速率增长小于25%,意味着带宽进入瓶颈,有部分数据进入了缓冲区。于是立即将发送速率减半,并进入排干阶段。 -
排干阶段
排干阶段主要目的通过减半速率让缓冲区逐渐清空数据。当outstanding package size(TCP发送出去还没被对方ack的值)≤BtlBW×RTT,这代表缓冲区数据已经处理完毕,所有流量都在链路中,就进入了稳健阶段。 -
稳健阶段
该阶段主要任务就是稳定发包。
同时,由于网络中可用带宽不是一成不变的,所以稳健阶段在不停地周期性探测最大可用带宽的变化趋势。简单来说,就是周期性地将发送速率乘以一个大于1的系数,检查可用带宽是否增加;同一周期内,再将发送速率除以同样的系数,保持平稳,并探测可用带宽是否变小。
通过上述三个阶段的处理,BBR对传统算法进行了有效优化,实了无论带宽升降,TCP发送速率都是小范围的波动,避免了突发的速率骤然升降,更好利用了可用带宽。
参考: