考虑充值是一项重要的功能,通常不希望因为查询余额接口调用过于频繁而导致充值功能不可用,现在引入Sentinel对payment-service服务的/balance接口做限流保护。
一、限流
在上一节payment-service代码上增加依赖:
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId> <version>${alibaba.version}</version> </dependency> <dependency> <groupId>com.alibaba.csp</groupId> <artifactId>sentinel-datasource-nacos</artifactId> <version>1.6.0</version> </dependency>
在bootstrap.yml中增加Sentinel的数据源设置:
spring: application: name: payment-service cloud: nacos: config: server-addr: 127.0.0.1:8848 discovery: server-addr: 127.0.0.1:8848 sentinel: datasource: ds1: nacos: server-addr: 127.0.0.1:8848 dataId: ${spring.application.name}-flow-rules data-type: json rule-type: flow
其中,数据源名称ds1任意设置即可。这里使用Nacos作为数据源,所以名称的下一级属性设置为nacos。
接下来按dataId在Nacos中创建配置
dataId:payment-service-flow-rules
格式:JSON
内容:
[ { "resource": "protected-resource", "controlBehavior": 2, "count": 1, "grade": 1, "limitApp": "default", "strategy": 0 } ]
修改PaymentController
在getBalance方法上增加注解:
@SentinelResource(value = "protected-resource", blockHandler = "handleBlock")
添加一个handleBlock方法,要求参数与getBalance保持一致,并且在最后增加一个BlockException参数
public Balance handleBlock(Integer id, BlockException e) { return new Balance(0, 0, 0, "限流"); }
在限流设置中,grade=1表示基于QPS/并发数做流量控制,count=1表示阈值为1,即QPS超过1触发。controlBehavior=0表示处理策略是直接拒绝。
重启payment-service,在浏览器中打开http://localhost:8082/pay/balance?id=1并迅速刷新,可以看到一部分的请求返回数据为handleBlock方法的返回值。
在Nacos中把count值改为1000,继续快速刷新浏览器,可以观察到不会再触发限流。
限流设置的主要参数:
参数 | 含义 | 选项 |
grade | 限流阈值类型 |
0 基于线程数 1 基于QPS |
count | 限流阈值 | |
controlBehavior | QPS流量控制中对超过阈值的流量处理手段 |
0 直接拒绝 1 Warm Up 2 匀速排队 |
strategy | 调用关系限流策略 |
0 根据调用方限流(limitApp) 1 根据调用链路入口限流 2 具有关系的资源流量控制 |
limitApp | 调用来源 | default 不区分调用者 {some_origin_name} 针对特定的调用者 other 针对除 {some_origin_name} 以外的其余调用方 |
匀速排队模式演示:
把controlBehavior设置为2,即匀速排队模式,同时增加一个参数maxQueueingTimeMs值为20000。再次快速刷新浏览器观察影响。
Sentinel控制台
Sentinel 提供一个轻量级的开源控制台,它提供机器发现以及健康情况管理、监控(单机和集群),规则管理和推送的功能。
下载地址
https://github.com/alibaba/Sentinel/releases
启动
java -Dserver.port=8718 -Dcsp.sentinel.dashboard.server=localhost:8718 -Dproject.name=sentinel -jar E:sentinel-dashboard-1.8.1.jar
如果我们需要修改端口,其中 -Dserver.port=8080 用于指定 Sentinel 控制台端口为 8080。需要注意,我们启动的时候需要使用绝对路径来启动
使用
http://localhost:8718/
(用户名和密码都是sentinel)
修改登录信息
https://github.com/alibaba/Sentinel/wiki/%E6%8E%A7%E5%88%B6%E5%8F%B0#%E9%89%B4%E6%9D%83
如果需要自定义登录用户名和密码等信息可以参考上面的文档;
用户可以通过如下参数进行配置:
-Dsentinel.dashboard.auth.username=sentinel 用于指定控制台的登录用户名为 sentinel;
-Dsentinel.dashboard.auth.password=123456 用于指定控制台的登录密码为 123456;如果省略这两个参数,默认用户和密码均为 sentinel;
-Dserver.servlet.session.timeout=7200 用于指定 Spring Boot 服务端 session 的过期时间,如 7200 表示 7200 秒;60m 表示 60 分钟,默认为 30 分钟;
我们可以下载到源码包,修改相应的配置。
修改payment-service的bootstrap.yml
spring: application: name: payment-service cloud: nacos: config: server-addr: 127.0.0.1:8848 discovery: server-addr: 127.0.0.1:8848 sentinel: eager: true transport: dashboard: localhost:8718 datasource: ds1: nacos: server-addr: 127.0.0.1:8848 dataId: ${spring.application.name}-flow-rules data-type: json rule-type: flow
重启应用后在Sentinel控制台中可以看到相关信息
二:熔断
限流从服务生产者角度考虑,使用Sentinel对服务做了限流保护,那么从消费者角度上,需要考虑另一种情况。
假设在用户登录时,为了简化客户端处理,account服务的登录接口在处理成功后会调用payment服务查询余额接口获得余额信息一并返回给客户端。当payment服务严重卡顿时,我们希望登录接口不会被拖慢,而是快速失败并降级。来看看Sentinel是如何解决的。
消费方应用account-service为基础,首先添加依赖:
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId> <version>${alibaba.version}</version> </dependency> <dependency> <groupId>com.alibaba.csp</groupId> <artifactId>sentinel-datasource-nacos</artifactId> <version>1.6.0</version> </dependency>
修改bootstrap.yml
spring: application: name: account-service cloud: nacos: config: server-addr: 127.0.0.1:8848 discovery: server-addr: 127.0.0.1:8848 sentinel: eager: true transport: dashboard: localhost:8718 datasource: ds1: nacos: server-addr: 127.0.0.1:8848 dataId: ${spring.application.name}-degrade-rules data-type: json rule-type: degrade ribbon: ConnectTimeout: 2000 ReadTimeout: 5000 feign: sentinel: enabled: true
在Nacos后台新建配置:
dataId:account-service-degrade-rules
格式:JSON
内容:
[ { "resource": "GET:http://payment-service/pay/balance", "count": 500, "grade": 0, "timeWindow": 10 } ]
以上配置的含义是:
当资源的平均响应时间超过阈值500毫秒之后,资源进入准降级状态。如果接下来1秒内持续进入5个请求的RT都持续超过这个阈值,那么在接下的时间窗口(timeWindow)之内,对这个方法的调用都会自动地熔断。
接下来修改Nacos中配置项payment-service-dev.properties的sleep值,修改为1000,让/pay/balance接口响应前先挂起1秒钟来模拟服务器卡顿情况。
分别启动两个服务,用浏览器打开http://localhost:8081/acc/user?id=1并连续刷新6次以上。可以观察到,从第7次开始接口不再等待1秒后返回,而是快速返回降级后的信息。
降级策略
grade | 说明 | count |
0 | 平均响应时间 (DEGRADE_GRADE_RT):当资源的平均响应时间超过阈值之后,资源进入准降级状态。如果接下来1s内持续进入5 个请求的RT都持续超过这个阈值,那么在接下的时间窗口之内,对这个方法的调用都会自动地熔断 | 单位ms, 上线4900 |
2 | 异常比例:当资源的每秒异常总数占通过量的比值超过阈值之后,资源进入降级状态 | 0.0-1.0 |
3 | 异常数:当资源近1分钟的异常数目超过阈值之后会进行熔断 |