做接口性能测试时,单用户时响应时间是50ms左右,而测10个用户并发时响应时间达到了260ms,虽然没有超出指标(300ms),但正常情况下单用户和10个用户并发时响应时间不应该相差那么大。
排查步骤:
1、查看是否有资源瓶颈
重新压测该接口,观察应用服务器、数据库服务器、压力机资源使用情况,发现使用率并不高,所以可以排除压力过大造成的资源瓶颈。
2、查看TPC是否能正常连接和释放
用netstat -nat|grep -i "端口"|grep TIME_WAIT|wc -l命令查看TIME_WAIT情况,如果TIME_WAIT的值很大并且一直增加的话,说明tcp不能正常释放,会造成响应时间增加。
可以看到TIME_WAIT的值并没有很大,也没有一直增加,可以排除tcp连接问题。
3、查看磁盘使用情况
因为测试环境调试时是info级别,发压力的时候会产生大量日志,占空间特别大,每清理一次过不了多久又快满了。
4、为避免稳定性测试的时候遇到磁盘满了导致场景停止的情况,写一个crontab定时任务定时清理日志。