zoukankan      html  css  js  c++  java
  • linux===sar命令性能监控

    sar介绍:

    sar是System Activity Reporter(系统活动情况报告)的缩写。sar工具将对系统当前的状态进行取样,然后通过计算数据和比例来表达系统的当前运行状态。它的特点是可以连续对系统取样,获得大量的取样数据;取样数据和分析的结果都可以存入文件,所需的负载很小。sar是目前Linux上最为全面的系统性能分析工具之一,可以从14个大方面对系统的活动进行报告,包括文件的读写情况、系统调用的使用情况、串口、CPU效率、内存使用状况、进程活动及IPC有关的活动等,使用也是较为复杂。

        摘自:《sar 找出系统瓶颈的利器》

    sar  -[*] 命令后报错的解决办法:

    报错内容如下:

    Cannot open /var/log/sysstat/sa21: No such file or directory
    Please check if data collecting is enabled
    解决办法
    root@botoo:/botoo/sayhello-master/sayhello-master# sar -f
    Cannot open /var/log/sysstat/sa21: No such file or directory
    Please check if data collecting is enabled
    root@botoo:/botoo/sayhello-master/sayhello-master# sudo chmod o+w /etc/default/sysstat 
    root@botoo:/botoo/sayhello-master/sayhello-master# vim /etc/default/sysstat
    root@botoo:/botoo/sayhello-master/sayhello-master# sar -r
    Cannot open /var/log/sysstat/sa21: No such file or directory
    Please check if data collecting is enabled
    root@botoo:/botoo/sayhello-master/sayhello-master# vim /etc/default/sysstat
    root@botoo:/botoo/sayhello-master/sayhello-master# sudo /etc/init.d/sysstat  restart
    [ ok ] Restarting sysstat (via systemctl): sysstat.service.
    root@botoo:/botoo/sayhello-master/sayhello-master# sar -r 5
    Linux 4.4.0-117-generic (botoo)     12/21/2018     _x86_64_    (1 CPU)
    
    04:14:37 PM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
    04:14:42 PM   1189180    858944     41.94    179468    338324    956016     46.68    559364 

    sar 参数说明

    • -A 汇总所有的报告
    • -a 报告文件读写使用情况
    • -B 报告附加的缓存的使用情况
    • -b 报告缓存的使用情况
    • -c 报告系统调用的使用情况
    • -d 报告磁盘的使用情况
    • -g 报告串口的使用情况
    • -h 报告关于buffer使用的统计数据
    • -m 报告IPC消息队列和信号量的使用情况
    • -n 报告命名cache的使用情况
    • -p 报告调页活动的使用情况
    • -q 报告运行队列和交换队列的平均长度
    • -R 报告进程的活动情况
    • -r 报告没有使用的内存页面和硬盘块
    • -u 报告CPU的利用率
    • -v 报告进程、i节点、文件和锁表状态
    • -w 报告系统交换活动状况
    • -y 报告TTY设备活动状况

    查看CPU使用率sar -u

    root@botoo:/# sar -u 1 3
    Linux 4.4.0-117-generic (botoo)     12/21/2018     _x86_64_    (1 CPU)
    
    04:28:00 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
    04:28:01 PM     all      0.00      0.00      1.00      0.00      0.00     99.00
    04:28:02 PM     all      1.00      0.00      0.00      0.00      0.00     99.00
    04:28:03 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
    Average:        all      0.34      0.00      0.34      0.00      0.00     99.33

    sar -u 1 3 后面的参数是1秒一次,总共采样3次

    可以看到这台机器使用了虚拟化技术,有相应的时间消耗; 各列的指标分别是:

    • %user 用户模式下消耗的CPU时间的比例;
    • %nice 通过nice改变了进程调度优先级的进程,在用户模式下消耗的CPU时间的比例
    • %system 系统模式下消耗的CPU时间的比例;
    • %iowait CPU等待磁盘I/O导致空闲状态消耗的时间比例;
    • %steal 利用Xen等操作系统虚拟化技术,等待其它虚拟CPU计算占用的时间比例;
    • %idle CPU空闲时间比例;

     查看平均负载 sar -q

    指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;与其它命令相比,它能查看各项指标随时间变化的情况;

    root@botoo:/# sar -q 1 4
    Linux 4.4.0-117-generic (botoo)     12/21/2018     _x86_64_    (1 CPU)
    
    04:34:01 PM   runq-sz  plist-sz   ldavg-1   ldavg-5  ldavg-15   blocked
    04:34:02 PM         0       172      0.04      0.01      0.00         0
    04:34:03 PM         0       172      0.04      0.01      0.00         0
    04:34:04 PM         0       172      0.04      0.01      0.00         0
    04:34:05 PM         0       172      0.04      0.01      0.00         0
    Average:            0       172      0.04      0.01      0.00         0
    • runq-sz:运行队列的长度(等待运行的进程数)
    • plist-sz:进程列表中进程(processes)和线程(threads)的数量
    • ldavg-1:最后1分钟的系统平均负载 ldavg-5:过去5分钟的系统平均负载
    • ldavg-15:过去15分钟的系统平均负载

    查看物理内存使用状况 sar -r

    root@botoo:/# sar -r  1 3
    Linux 4.4.0-117-generic (botoo)     12/21/2018     _x86_64_    (1 CPU)
    
    04:37:33 PM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
    04:37:34 PM   1188936    859188     41.95    179552    338332    956016     46.68    559508    192224         0
    04:37:35 PM   1188968    859156     41.95    179552    338332    956016     46.68    559508    192224         0
    04:37:36 PM   1188968    859156     41.95    179552    338332    956016     46.68    559508    192224         0
    Average:      1188957    859167     41.95    179552    338332    956016     46.68    559508    192224         0
    • kbmemfree:这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.
    • kbmemused:这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间.
    • %memused:物理内存使用率,这个值是kbmemused和内存总量(不包括swap)的一个百分比.
    • kbbuffers和kbcached:这两个值就是free命令中的buffer和cache.
    • kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
    • %commit:这个值是kbcommit与内存总量(包括swap)的一个百分比

    查看页面交换发生状况  sar -W

    页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用这个命令来确认是否发生了大量的交换;

    root@botoo:/# sar -W 1 3
    Linux 4.4.0-117-generic (botoo)     12/21/2018     _x86_64_    (1 CPU)
    
    04:41:09 PM  pswpin/s pswpout/s
    04:41:10 PM      0.00      0.00
    04:41:11 PM      0.00      0.00
    04:41:12 PM      0.00      0.00
    Average:         0.00      0.00
    • pswpin/s:每秒系统换入的交换页面(swap page)数量
    • pswpout/s:每秒系统换出的交换页面(swap page)数量

    要判断系统瓶颈问题,有时需几个 sar 命令选项结合起来;

    • 怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看
    • 怀疑内存存在瓶颈,可用sar -B、sar -r 和 sar -W 等来查看
    • 怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看
  • 相关阅读:
    Edit Distance编辑距离(NM tag)- sam/bam格式解读进阶
    《开讲啦》 20160910 颜宁:女科学家去哪儿了?
    pysam
    Python项目实战
    最小二乘估计法
    最大似然估计(Maximum Likelihood,ML)
    HMM隐马尔科夫模型
    贝叶斯推断|朴素贝叶斯分类|贝叶斯定理
    解决“tar:Exiting with failure status due to previous errors”【转】
    df -h执行卡住不动问题解决【转】
  • 原文地址:https://www.cnblogs.com/botoo/p/10156711.html
Copyright © 2011-2022 走看看