zoukankan      html  css  js  c++  java
  • [转]Linux性能监控专题vmstat命令

    前言

    vmstat是监控linux服务器性能的重要工具之一,vmstat可以实时监控cpu运行队列和系统关键的性能指标,如磁盘,上下文交换,cpu使用率等。

    CPU load

    CPU队列中等待运行的任务数量+正在运行的任务数量之和

    等待运行的任务一般是uninterruptible sleep的任务,不可中断的意思是通过kill -9 杀不掉的进程,通常是本地磁盘IO的任务

    vmstat结果内容的解释

    Vmstat

    procs -----------memory----------       ---swap--   -----io----       --system--   -----cpu------
            r b   swpd   free    buff       cache   si   so      bi    bo         in   cs          us sy id wa st
            2 0   88   199564 134860 1175252   0    0        0   352        9323 10496     8 6   85 0 0


    procs 
    r 列表示运行和等待cpu时间片的进程数,如果长期大于1,说明cpu不足,需要增加cpu。 
    b 列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。

    memory 
    swpd 切换到内存交换区的内存数量(k表示)。如果swpd的值不为0,或者比较大,比如超过了100m,只要si、so的值长期为0,系统性能还是正常 
    free 当前的空闲页面列表中内存数量(k表示) 
    buff 作为buffer cache的内存数量,一般对块设备的读写才需要缓冲。 
    cache: 作为page cache的内存数量,一般作为文件系统的cache,如果cache较大,说明用到cache的文件较多,如果此时IO中bi比较小,说明文件系统效率比较好。

    swap 
    si 由内存进入内存交换区数量。 
    so由内存交换区进入内存数量。

    IO 
    bi 从块设备读入数据的总量(读磁盘)(每秒kb)。 
    bo 块设备写入数据的总量(写磁盘)(每秒kb) 
    这里我们设置的bi+bo参考值为1000,如果超过1000,而且wa值较大应该考虑均衡磁盘负载,可以结合iostat输出来分析。

    system 显示采集间隔内发生的中断数 
    in 列表示在某一时间间隔中观测到的每秒设备中断数。 
    cs列表示每秒产生的上下文切换次数,如当 cs 比磁盘 I/O 和网络信息包速率高得多,都应进行进一步调查。

    cpu 表示cpu的使用状态 
    us 列显示了用户方式下所花费 CPU 时间的百分比。us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,需要考虑优化用户的程序。 
    sy 列显示了内核进程所花费的cpu时间的百分比。这里us + sy的参考值为80%,如果us+sy 大于 80%说明可能存在CPU不足。 
    wa 列显示了IO等待所占用的CPU时间的百分比。这里wa的参考值为30%,如果wa超过30%,说明IO等待严重,这可能是磁盘大量随机访问造成的,也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。 
    id 列显示了cpu处在空闲状态的时间百分比

    vmstat命令输出分成六个部分: 
    (1)进程procs: 
    r:在运行队列中等待的进程数 。 
    b:在等待io的进程数 。 
    (2)内存memoy: 
    swpd:现时可用的交换内存(单位KB)。 
    free:空闲的内存(单位KB)。 
    buff: 缓冲去中的内存数(单位:KB)。 
    cache:被用来做为高速缓存的内存数(单位:KB)。 
    (3) swap交换页面 
    si: 从磁盘交换到内存的交换页数量,单位:KB/秒。 
    so: 从内存交换到磁盘的交换页数量,单位:KB/秒。 
    (4) io块设备: 
    bi: 发送到块设备的块数,单位:块/秒。 
    bo: 从块设备接收到的块数,单位:块/秒。 
    (5)system系统: 
    in: 每秒的中断数,包括时钟中断。 
    cs: 每秒的环境(上下文)切换次数。 
    (6)cpu中央处理器: 
    cs:用户进程使用的时间 。以百分比表示。 
    sy:系统进程使用的时间。 以百分比表示。 
    id:中央处理器的空闲时间 。以百分比表示。

    如果 r经常大于 4 ,且id经常小于40,表示中央处理器的负荷很重。

    如果bi,bo 长期不等于0,表示物理内存容量太小。

     

    vmstat输出时间标示.

    vmstat 1 1 | awk '{print system('date +%H:%M:%S'),$0}'

    vmstat:报告关于内核进程,虚拟内存,磁盘,cpu的的活动状态的工具 
    主要有几个用法: 
    1.vmstat 间隔 测试数量 
    输出如下 
    kthr     memory   page faults cpu 
    -----   -----------   ------------------------ ------------ ----------- 
    r b avm fre re pi po fr sr cy in sy cs us sy id wa 
    0 0 26258 18280 0 0 0 7 20 0 127 227 64 1 2 96 1

    procs -----------memory----------        ---swap-- -----io---- --system--          -----cpu------
            r b    swpd   free   buff cache            si   so      bi    bo       in   cs             us sy id wa st

    4 0     88 336220 255096 934424       0    0     0     0      11415 15111      10 9 82 0 0
           4 0     88 336344 255096 934424       0    0     0    12     12621 17560      11 10 79 0 0
           3 0     88 336220 255100 934460       0    0     0   268    12245 16786      12 10 78 0 0
    其中: 
        kthr--内核进程的状态 
    --r 运行队列中的进程数,在一个稳定的工作量下,应该少于5 (r <5)
    --b 等待队列中的进程数(等待I/O),通常情况下是接近0的. (b=0)

    memory--虚拟和真实内存的使用信息 
    --avm 活动虚拟页面,在进程运行中分配到工作段的页面空间数. 
    --fre 空闲列表的数量.一般不少于120,当fre少于120时,系统开始自动的kill进程去释放


    free list 
    page--页面活动的信息 
    --re 页面i/o的列表 
    --pi 从页面输入的页(一般不大于5) 
    --po 输出到页面的页 
    --fr 空闲的页面数(可替换的页面数) 
    --sr 通过页面置换算法搜索到的页面数 
    --cy 页面置换算法的时钟频率


    faults--在取样间隔中的陷阱及中断数 
    --in 设备中断 
    --sy 系统调用中断 
    --cs 内核进程前后交换中断


    cpu--cpu的使用率 
    --us 用户进程的时间 
    --sy 系统进程的时间 
    --id cpu空闲的时间 
    --wa 等待i/o的时间


    一般us+sy 在单用户系统中不大于90,在多用户系统中不大于80. 
    wa时间一般不大于40.

    2.vmstat -s 
    现实系统自初始化以来的页面信息.

    top是给Linux设计的。在FreeBSD VM里面的Free概念和其他OS完全不同,使用top查看Free内存对于FreeBSD来说可以说没什么意义。正确的方法是看vmstat。

    # vmstat

    procs    memory    page                disk faults    cpu

    r b w     avm fre   flt   re   pi   po   fr   sr ad0 in sy   cs us sy id

    0 2 1   270512   20316 30 0 0 0   26 5 1223 1589 98 593   1   1 99

    最好使用vmstat t [n]命令,例如 vmstat 5 5,表示在T(5)秒时间内进行N(5)次采样。如果只使用vmstat,无法反映真正的系统情况。

    procs:

    r-->在运行的进程数

    b-->在等待io的进程数(等待i/o,paging等等)

    w-->可以进入运行队列但被替换的进程

    memoy(以k为单位,包括虚拟内核和真实内存,正在运行或最近20秒在运行的进程所用的虚拟内存将被视为active)

    avm-->活动的虚拟内存

    free-->空闲的内存

    pages(统计错误页和活动页,每5秒平均一下,以秒为单位给出数值)

    flt-->错误页总数

    re-->回收的页面

    pi-->进入页面数

    po-->出页面数

    fr-->空余的页面数

    sr-->每秒通过时钟算法扫描的页面

    disk 显示每秒的磁盘操作(磁盘名字的前两个字母加数字,默认只显示两个磁盘,如果有多的,可以加-n来增加数字或在命令行下把磁盘名都填上。)

    fault 显示每秒的中断数

    in-->设备中断

    sy-->系统中断

    cy-->cpu交换

    cpu 表示cpu的使用状态

    cs-->用户进程使用的时间

    sy-->系统进程使用的时间

    id-->cpu空闲的时间

    解释:

    如果 r经常大于 4 ,且id经常少于40,表示cpu的负荷很重。

    如果pi,po 长期不等于0,表示内存不足。

    如果disk 经常不等于0, 且在 b中的队列 大于3, 表示 io性能不好。

    Procs 
    r: 等待运行的进程数 b: 处在非中断睡眠状态的进程数 w: 被交换出去的可运行的进程数。此数由 linux 计算得出,但 linux 并不耗尽交换空间

    Memory

    swpd: 虚拟内存使用情况,单位:KB
    free: 空闲的内存,单位KB
    buff: 被用来做为缓存的内存数,单位:KB
    Swap 
    si: 从磁盘交换到内存的交换页数量,单位:KB/秒
    s 从内存交换到磁盘的交换页数量,单位:KB/秒
    IO 
    bi: 发送到块设备的块数,单位:块/秒
    b 从块设备接收到的块数,单位:块/秒
    System 
    in: 每秒的中断数,包括时钟中断
    cs: 每秒的环境(上下文)切换次数
    CPU 
    按 CPU 的总使用百分比来显示 
    us: CPU 使用时间
    sy: CPU 系统使用时间
    id: 闲置时间
    准测
    r<5,b≈0,

    如果fre对于page列,re,pi,po,cy维持于比较稳定的状态,PI率不超过5,如果有pagin发生,那么关联页面必须先进行pageout在内存相对紧张的环境下pagein会强制对不同的页面进行steal操作。如果系统正在读一个大批的永久页面,你也许可以看到po和pi列会出现不一致的增长,这种情景并不一定表明系统负载过重,但是有必要对应用程序的数据访问模式进行见检查。在稳定的情况下,扫描率和重置率几乎相等,在多个进程处理使用不同的页面的情况下,页面会更加不稳定和杂乱,这时扫描率可能会比重置率高出。

  • 相关阅读:
    我不为人人,人人不为我
    sed 小结
    linux 之 压缩 / 解压
    java arraylist的问题
    flex swf和movieclip之前的微妙关系
    Flex contextMenu
    。。
    数据库
    flex Vector
    浮动ip
  • 原文地址:https://www.cnblogs.com/sidesky/p/3079622.html
Copyright © 2011-2022 走看看