排队等待,我说的比较通俗点,就是 服务器匀速处理请求,当超过阈值的后的其他请求就排队,当排队时间过了超时时间,就返回提示信息。
比如:现在QPS阈值为5,直接且排队等待,超时时间2s,现在有100个请求过来,服务器最多处理 5 个,其他慢慢排队,在处理所有的请求的时候,都是均匀的处理,0.01S处理第一个请求,0.21S处理第二个请求,0.41S请求处理第三个请求...0.81S处理第5个请求,然后依次类推,间隔时间为 1秒/QPS,比如1/5,0.2S处理一个请求;在排队的请求,如果排队的时间超过了超时时间,就不再等待,返回给客户端一个提示信息。
注意:排队等待只能是 QPS
该流控模式和效果适用的场景: