一、回顾:计算器算法存在问题
对于秒级以上的时间周期来说,会存在一个非常严重的问题,那就是临界问题。
从上图中我们可以看到,假设有一个恶意用户,他在0:59时,瞬间发送了100个请求,并且1:00又瞬间发送了100个请求,那么其实这个用户在 1秒里面,瞬间发送了200个请求。我们刚才规定的是1分钟最多100个请求,也就是每秒钟最多1.7个请求,用户通过在时间窗口的重置节点处突发请求, 可以瞬间超过我们的速率限制。用户有可能通过算法的这个漏洞,瞬间压垮我们的应用。
下面就说说如何解决这个由于问题。计算器的问题其实是因为我们统计的精度太低(统计的1秒内的流量情况,只有1个值进行记录)。那么如何很好地处理这个问题呢?或者说,如何将临界问题的影响降低呢?我们可以看下面的滑动窗口算法。
二、滑动窗口算法
滑动窗口,又称rolling window。为了解决计数器法统计精度太低的问题,引入了滑动窗口算法。下面这张图,很好 地解释了滑动窗口算法:
是一分钟。然后我们将时间窗口进行划分,比如图中,我们就将滑动窗口划成了6格,所以每格代表的是10秒钟。每过10秒钟,我们的时间窗口就会往右滑动一格。每一个格子都有自己独立的计数器counter,比如当一个请求 在0:35秒的时候到达,那么0:30~0:39对应的counter就会加1。
那么滑动窗口怎么解决刚才的临界问题的呢?在上图中,0:59到达的100个请求会落在灰色的格子中,而1:00到达的请求会落在橘×××的格子中。当时间到达1:00时,我们的窗口会往右移动一格,那么此时时间窗口内的总请求数量一共是200个,超过了限定的100个,所以此时能够检测出来触发了限流。
回顾一下上面的计数器算法,我们可以发现,计数器算法其实就是滑动窗口算法。只是它没有对时间窗口做进一步地划分,所以只有1格。
由此可见,当滑动窗口的格子划分的越多,那么滑动窗口的滚动就越平滑,限流的统计就会越精确。
BTW:
(1)滑动窗口算法是以当前这个时间点为基准,往前推移1秒进行计算当前1秒内的请求量情况。
(2)滑动窗口限流统计的精准度是由划分的格子多少决定的,这个怎么理解呐,就是把1秒中进行划分成多个时间段,比如2个格子的话,那么就是2段,0-500ms和501-1000ms。那么就会两个值进行存储统计请求量,比如数组[0,1] 各存储一个段的请求值。
(3)计算器算法是滑动窗口算法将时间段划分为1的特殊情况。
综上我们对滑动窗口算法下个定义:滑动窗口算法是将时间周期分为N个小周期,分别记录每个小周期内访问次数,并且根据时间滑动删除过期的小周期。
三、滑动窗口算法实现
我们看一段代码:
/** * 滑动时间窗口限流实现 * 假设某个服务最多只能每秒钟处理100个请求,我们可以设置一个1秒钟的滑动时间窗口, * 窗口中有10个格子,每个格子100毫秒,每100毫秒移动一次,每次移动都需要记录当前服务请求的次数 */ public class SlidingTimeWindow { // 时间窗口内最大请求数 public final int limit = 100; // 服务访问次数 Long counter = 0L; // 使用LinkedList来记录滑动窗口的10个格子。 LinkedList<Long> slots = new LinkedList<Long>(); // 时间划分多少段落 int split = 10; // 是否限流了,true:限流了,false:允许正常访问。 boolean isLimit = false; private void doCheck() throws InterruptedException { while (true) { slots.addLast(counter); if (slots.size() > split) { slots.removeFirst();// 超出了,就把第一个移出。 } // 比较最后一个和第一个,两者相差100以上就限流 if ((slots.peekLast() - slots.peekFirst()) > limit) { System.out.println("限流了。。"); // 修改限流标记为true isLimit = true; } else { // 修改限流标记为false isLimit = false; } Thread.sleep(1000/split); } } /** * 测试 * @param args * @throws InterruptedException */ public static void main(String[] args) throws InterruptedException { SlidingTimeWindow timeWindow = new SlidingTimeWindow(); //开启一个线程判断当前的限流情况. new Thread(new Runnable() { @Override public void run() { try { timeWindow.doCheck(); } catch (InterruptedException e) { e.printStackTrace(); } } }).start(); //模拟请求. while(true) { //判断是否被限流了. if(!timeWindow.isLimit) { timeWindow.counter++; //未被限流执行相应的业务方法. // executeBusinessCode(); //模拟业务执行方法时间. Thread.sleep(new Random().nextInt(15)); System.out.println("业务方法执行完了..."); }else { System.out.println("被限流了,直接返回给用户"); } } } }
说明:
(1)doCheck方法,就是改变是否限流标志位的方法:这里通过LinkedList(链表)来进行模拟,通过LinkedList的大小来控制1秒分隔多少段。peekLast()、slots.peekFirst()就是这个时间窗口的一个流量值。
(2)在main方法中,我们通过开启一个线程来执行我们的doCheck()方法,由于doCheck()方法是while(true),所以会一直执行,sleep的时间刚好是每个时间间隔值,那么就会不断刷新LinkedList中的值。
(3)最后while(true)代码是模拟业务执行调用代码,也就是controller发起调用的代码了。
四、小结:
(1)滑动窗口算法是将时间周期分为N个小周期,分别记录每个小周期内访问次数,并且根据时间滑动删除过期的小周期。
(2)计算器算法也属于滑动窗口算法,是滑动窗口算法的一种情况(划分周期为1)。
(3)滑动窗口算法实现方式:数组(多少周期,数组大小就是多大,将每个时间通过一定的算法落到每个数组下标即可);链表(通过链表中的大小来判断划分周期个数,如果超过了,可以使用链表的removeFirst()移除第一个,从而实现往后移动窗口)
(4)数组实现的实例:这个可以看Sentinel的源码,就是定义了一个数组来实现的,时间划分是2。
五、小思考
当在系统刚刚启动的时候,系统很多资源都未分配完成,瞬间来了n个请求,如果使用滑动窗口算法的话,那么只有达到了QPS控制阈值,才会触发限流机制,那么这样针对系统刚启动资源未分配的情况,就无法防止系统瘫痪了。
针对上面的这种情况,那么你有什么对应的限流算法可以应对呐?