zoukankan      html  css  js  c++  java
  • JMeterPlugin性能监控

    GUI界面中的plugins manager中的jpgc-Standard set,其中共包含以下的文件:
      jpgc-dummy
      jpgc-fifo
      jpgc-graphs-basic
      jpgc-perfmon
      jpgc-tst
      jpgc-sense
      jpgc-functions
      jpgc-casutg
      jpgc-ffw

    界面

    线程组

     
    image.png

    jp@gc - Stepping Thread Group,如下图
    建立压力模型,持续加压


     
    image.png

    This Group will start 100 threads:这次的测试总共会起100个线程。
    First , wait for 10 seconds:等待10s后开始起线程,也就是不等待直接起线程。
    Then start 1 threads :最开始启动1个线程
    Next add:10 threads every:10 using ramp-up:5 每10秒在5秒内启动10个线程
    Then hold load for 12 seconds. :全部的线程起来后,运行12s 后开始停止(跟loadrunner类似,从jmeter聚合报告里面可以看出来,这里的hold load 的意思,其实是这些线程,一直在请求,相当于jmeter普通线程组里面的循环运行)。
    Finally , stop 5 threads every 10 seconds:每隔10秒停止5个线程

    jp@gc - Ultimate Thread Group,如下图

     
    image.png

    跟上面那个线程组有些类似,不过这个是几个设置的结合,像这里有设置两个线程组(1、不延迟,20s内起100个线程,hold 60s后,10s内停止;),执行的时候,这两个线程组是同时按照自己的规则开始执行的,每一时刻,得到的结果都是两个线程组的叠加。

    监控器

    jp@gc - Active Threads Over Time
    不同时间活动用户数量展示(图表)

     
    image.png

    jp@gc - Flexible File Writer
    这个插件允许你灵活记录测试结果
    Filename:结果记录的地方
    Overwirte existing file:是否覆盖这个文件
    Write File Header:文件的头(即文件的第一行)
    Record each sample:记录不同的sample(记录哪些内容,什么顺序,如何隔开不同的值)
    Write File Footer:文件的结尾(即文件的最后一行)

     
    image.png

    jp@gc - PerfMon Metrics Collector
    服务器性能监测控件,包括CPU,Memory,Network,I/O等等(此功能用到在需监听的服务器上启动startAgent)
    Add Row 可以添加需要监控的服务器ip,端口号默认为4444,监控内容CPU/MEMORY/DISKS I/O等

     
    image.png

    jp@gc - Response Times Over Time
    响应时间超时,显示每个采样以毫秒为单位的平均响应时间
    展示响应时间曲线

     
    image.png

    jp@gc - Transactions per Second
    每秒事务数,服务器每秒处理的事务数
    用于展示TPS曲线

     
    image.png

    ServerAgent

    下载解压ServerAgent-2.2.1.zip文件,将解压后的文件夹放在需要监控的服务器端,Linux和windows通用,只需启动服务即可
    默认端口是4444,如果占用需要修改

     
    image.png

    windows平台运行ServerAgent.jar文件

    linux服务器上首先将startAgent.sh设定为可执行文件:
    chmod 777 startAgent.sh
    ./startAgent.sh执行文件
    如果要将该文件设置为后台执行不关闭
    Nohup ./startAgent.sh &

    在服务器上开启startAgent服务后,再在jmeter上运行脚本,可以在jp@gc - PerfMon Metrics Collector上查看监控的图形结果

    性能测试中服务器关键性能指标

    - 业务指标:如吞吐量(QPS、TPS)、响应时间(RT)、并发数、业务成功率等
    - 资源指标:如CPU、内存、Disk I/O、Network I/O等资源的消耗情况

    一. CPU

    关于CPU资源,有三个重要概念:使用率、运行队列和上下文切换,这里借助一张描述进程状态的图来进行简要说明:

     
    image.png
    • Running:正在运行的进程
    • Waiting:已准备就绪,等待运行的进程
    • Blocked:因为等待某些事件完成而阻塞的进程,通常是在等待I/O,如Disk I/O,Network I/O等。

    这里的Running和Waiting共同构成Linux进程状态中的可运行状态(task_running),而Blocked状态可以对应Linux进程状态中的不可中断睡眠状态(task_uninterruptible)

    在Linux可以使用vmstat来获取这些数据:

    [hbase@ecs-097 ~]$ vmstat 1
    procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
     r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
     6  0      0 4591436 176804 1185380    0    0     0     0 7915 10357 83  5 12  0  0

     

    CPU使用率(CPU Utilization Percentages):有进程处于Running状态的时间/总时间。在vmstat主要通过ussyid三列数据来体现:

    • us:用户占用CPU的百分比
    • sy:系统(内核和中断)占用CPU的百分比
    • id:CPU空闲的百分比

    性能测试指标中,CPU使用率通常用us + sy来计算,其可接受上限通常在70%~80%。另外需要注意的是,在测试过程中,如果sy的值长期大于25%,应该关注in(系统中断)和cs(上下文切换)的数值,并根据被测应用的实现逻辑来分析是否合理。

    运行队列进程数(Processes on run queue):Running状态 + Waiting状态的进程数,展示了正在运行和等待CPU资源的任务数,可以看作CPU的工作清单,是判断CPU资源是否成为瓶颈的重要依据。vmstat通过r的值来体现:

    • r: 可运行进程数,包括正在运行(Running)和已就绪等待运行(Waiting)的。

    如果r的值等于系统CPU总核数,则说明CPU已经满负荷。在负载测试中,其可接受上限通常不超过CPU核数的2倍。

    上下文切换(Context Switches):简单来说,context指CPU寄存器和程序计数器在某时间点的内容,(进程)上下文切换即kernel挂起一个进程并将该进程此时的状态存储到内存,然后从内存中恢复下一个要执行的进程原来的状态到寄存器,从其上次暂停的执行代码开始继续执行至频繁的上下文切换将导致sy值增长。vmstat通过cs的值来体现:

    • cs:每秒上下文切换次数。

    另外还有一个指标用来作为系统在一段时间内的负载情况的参考:

    平均负载Load Average:在UNIX系统中,Load是对系统工作量的度量。Load取值有两种情况,多数UNIX系统取运行队列的值(vmstat输出的r),而Linux系统取运行队列的值 + 处于task_uninterruptible状态的进程数(vmstat输出的b),所以会出现CPU使用率不高但Load值很高的情况。Load Average就是在一段时间内的平均负载,系统工具top、uptime等提供1分钟、5分钟和15分钟的平均负载值。

    [hbase@ecs-097 ~]$ top
    top - 19:23:28 up 18:05,  3 users,  load average: 0.80, 0.60, 0.53

     

    上面示例中的0.80即是1分钟内的Load average,以此类推。
    当我们需要了解当前系统负载情况时,可以先查看Load average的值,如果系统持续处于高负载(如15分钟平均负载大于CPU总核数的两倍),则查看vmstat的r值和b值来确认是CPU负荷重还是等待I/O的进程太多。

    二. Memory

    Memory资源也有三方面需要关注:可用内存,swap占用,页面交换(Paging),仍然借助一张图来说明:

     
    image.png

    这里讲到的内存,包括物理内存和虚拟内存,如上图所示,物理内存和硬盘上的一块空间(SWAP)组合起来作为虚拟内存(Virtual Memory)为进程的运行提供一个连续的内存空间,这样的好处是进程可用的内存变大了,但需要注意的是,SWAP的读写速度远低于物理内存,并且物理内存和swap之间的数据交换会增加系统负担。虚拟内存被分成页(x86系统默认页大小为4k),内核读写虚拟内存以页为单位,当物理内存空间不足时,内存调度会将物理内存上不常使用的内存页数据存储到磁盘的SWAP空间,物理内存与swap空间之间的数据交换过程称为页面交换(Paging)。

    可用内存(free memory):内存占用的直观数据,vmstat输出free的值,可用内存过小将影响整个系统的运行效率,对于稳定运行的系统,free可接受的范围通常应该大于物理内存的20%,即内存占用应该小于物理内存的80%。在压力测试时,系统内存资源的情况应该用可用内存结合页面交换情况来判断,如果可以内存很少,但页面交换也很少,此时可以认为内存资源还对系统性能构成严重影响。

    页面交换(Paging):页面交换包括从SWAP交换到内存和从内存交换到SWAP,如果系统出现频繁的页面交换,需要引起注意。可以从vmstat的si和so获取:

    • si:每秒从SWAP读取到内存的数据大小
    • so:每秒从内存写入到SWAP的数据大小

    SWAP空间占用:可以从vmstat的swpd来获取当前SWAP空间的使用情况,应该和页面交换结合来分析,比如当swpd不为0,但si,so持续保持为0时,内存资源并没有成为系统的瓶颈。

    三. Disk

    磁盘通常是系统中最慢的一环,一是其自身速度慢,即使是SSD,其读写速度与内存都还存在数量级的差距,二是其离CPU最远。另外需要说明的是磁盘IO分为随机IO顺序IO两种类型,在性能测试中应该先了解被测系统是偏向哪种类型。

    • 随机IO:随机读写数据,读写请求多,每次读写的数据量较小,其IO速度更依赖于磁盘每秒能IO次数(IOPS)。

    • 顺序IO:顺序请求大量数据,读写请求个数相对较少,每次读写的数据量较大,顺序IO更重视每次IO的数据吞吐量。

    对于磁盘,首要关注使用率,IOPS和数据吞吐量,在Linux服务区,可以使用iostat来获取这些数据。

    [hbase@ecs-097 ~]$ iostat -dxk 1
    Linux 2.6.32-504.3.3.el6.x86_64 (ecs-097)     08/01/2016     _x86_64_    (4 CPU)
    avg-cpu:  %user   %nice %system %iowait  %steal   %idle
               0.52    0.00    0.13    0.06    0.00   99.28
    Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
    xvda              0.10     6.63    0.40    2.57     6.22    36.80    29.00     0.04   14.63   1.19   0.35

    (设备)使用率:统计过程中处理I/O请求的时间与统计时间的百分比,即iostat输出中的%util,如果该值大于60%,很可能降低系统的性能表现。

    IOPS:每秒处理读/写请求的数量,即iostat输出中的r/s和w/s,个人PC的机械硬盘IOPS一般在100左右,而各种公有云/私有云的普通服务器,也只在百这个数量级。预先获取到所用服务区的IOPS能力,然后在性能测试中监控试试的IOPS数据,来衡量当前的磁盘是否能满足系统的IO需求。

    数据吞吐量:每秒读/写的数据大小,即iostat输出中的rkB/s和wkB/s,通常磁盘的数据吞吐量与IO类型有直接关系,顺序IO的吞吐能力明显优与随机读写,可以预先测得磁盘在随机IO和顺序IO下的吞吐量,以便于测试时监控到的数据进行比较衡量。

    四. Network

    网络本身是系统中一个非常复杂的部分,但常规的服务端性能测试通常放在一个局域网进行,因为我们首先关注被测系统自身的性能表现,并且需要保证能在较少的成本下发起足够大的压力。因此对于多数系统的性能测试,我们主要关注网络吞吐量即可,对于稳定运行的系统,需要为被测场景外的业务流出足够的带宽;在压力测试过程中,需要注意瓶颈可能来自于带宽。
    在Linuxf服务器,可以使用iptraf来查看本机网络吞吐量,如:

    [root@ecs-097 ~]# iptraf -d eth0
    x Total rates:         67.8 kbits/sec        Broadcast packets:            0x
    x                      54.2 packets/sec      Broadcast bytes:              0                                                                                                                x
    x                                                                                                                                                                                           x
    x Incoming rates:      19.2 kbits/sec                                                                                                                                                       x
    x                      25.4 packets/sec                                                                                                                                                     x
    x                                            IP checksum errors:           0                                                                                                                x
    x Outgoing rates:      48.7 kbits/sec                                                                                                                                                       x
    x                      28.8 packets/sec

    五. 总结

    性能测试中,数据收集很重要,但是更重要的是快速抓住关键数据,读懂数据的含义。
    本文主要介绍服务端性能测试中,对于CPU、内存等各种系统资源,通常首要关注的数据,以及这些数据在Linux服务器上的获取方式。
    在实际测试中,通常会持续收集这些数据,如使用nmon,JMeter的PerfMon插件,以及zabbix等专门的系统监控工具

    参考资料
    Load (computing)
    Process state
    Linux Performance Analysis in 60,000 Milliseconds

  • 相关阅读:
    jvm参数陷阱
    concurrent mode failure
    17.Quick QML-SpinBox
    16.Quick QML-ButtonGroup、RadioButton、CheckBox
    15.Quick QML-TextEdit和TextArea
    14.Quick QML-TextInput和TextField详解
    13.Quick QML-RowLayout、ColumnLayout、GridLayout布局管理器介绍、并通过GridLayout设计的简易网站导航界面
    9.qml-property自定义属性
    macOS 系统安装Maven教程
    macOS系统上 为Github 托管项目的访问添加SSH keys
  • 原文地址:https://www.cnblogs.com/insane-Mr-Li/p/10140129.html
Copyright © 2011-2022 走看看