zoukankan      html  css  js  c++  java
  • linux性能分析工具介绍(CPU,内存,磁盘I/O,网络)

    一. CPU性能评估

    1.vmstat [-V] [-n] [depay [count]]

    -V : 打印出版本信息,可选参数

    -n : 在周期性循环输出时,头部信息仅显示一次

    delay : 两次输出之间的时间间隔

    count : 按照delay指定的时间间隔统计的次数。默认是1

    如:vmstat 1 3

    user1@user1-desktop:~$ vmstat 1 3

    procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----

    r b swpd free buff cache si so bi bo in cs us sy id wa

    0 0 0 1051676 139504 477028 0 0 46 31 130 493 3 1 95 2

    0 0 0 1051668 139508 477028 0 0 0 4 377 1792 3 1 95 0

    0 0 0 1051668 139508 477028 0 0 0 0 327 1741 3 1 95 0

    r : 运行和等待CPU时间片的进程数(若长期大于CPU的个数,说明CPU不足,需要增加CPU)

    b : 在等待资源的进程数(如等待I/O或者内存交换等)

    swpd : 切换到内存交换区的内存数量,单位kB

    free : 当前空闲物理内存,单位kB

    buff : buffers cache的内存数量,一般对块设备的读写才需要缓存

    cache : page cached的内存数量,一般作为文件系统cached,频繁访问的文件都会被cached

    si : 由磁盘调入内存,即内存进入内存交换区的数量

    so : 内存调入磁盘,内存交换区进入内存的数量

    bi : 从块设备读入数据的总量,即读磁盘,单位kB/s

    bo : 写入到块设备的数据总量,即写磁盘,单位kB/s

    in : 某一时间间隔中观测到的每秒设备中断数

    cs : 每秒产生的上下文切换次数

    us :用户进程消耗的CPU时间百分比【注意】

    sy : 内核进程消耗CPU时间百分比【注意】

    id : CPU处在空闲状态的时间百分比【注意】

    wa :IO等待所占用的CPU时间百分比

    如果si、so的值长期不为0,表示系统内从不足,需要增加系统内存

    bi+bo参考值为1000,若超过1000,且wa较大,表示系统IO有问题,应该提高磁盘的读写性能

    in与cs越大,内核消耗的CPU时间就越多

    us+sy参考值为80%,如果大于80%,说明可能存在CPU资源不足的情况

    综上所述,CPU性能评估中重点注意r、us、sy和id列的值。

    2. sar [options] [-o filename] [interval [count] ]

    options:

    -A :显示系统所有资源设备(CPU、内存、磁盘)的运行状态

    -u : 显示系统所有CPU在采样时间内的负载状态

    -P : 显示指定CPU的使用情况(CPU计数从0开始)

    -d : 显示所有硬盘设备在采样时间内的使用状况

    -r : 显示内存在采样时间内的使用状况

    -b : 显示缓冲区在采样时间内的使用情况

    -v : 显示进程、文件、I节点和锁表状态

    -n :显示网络运行状态。参数后跟DEV(网络接口)、EDEV(网络错误统计)、SOCK(套接字)、FULL(显示其它3个参数所有)。可单独或一起使用

    -q : 显示运行队列的大小,与系统当时的平均负载相同

    -R : 显示进程在采样时间内的活动情况

    -y : 显示终端设备在采样时间内的活动情况

    -w : 显示系统交换活动在采样时间内的状态

    -o : 将命令结果以二进制格式存放在指定的文件中

    interval : 采样间隔时间,必须有的参数

    count : 采样次数,默认1

    如:sar -u 1 3

    user1@user1-desktop:~$ sar -u 1 3

    Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)

    09时27分18秒 CPU %user %nice %system %iowait %steal %idle

    09时27分19秒 all 1.99 0.00 0.50 5.97 0.00 91.54

    09时27分20秒 all 3.90 0.00 2.93 5.85 0.00 87.32

    09时27分21秒 all 2.93 0.00 1.46 4.39 0.00 91.22

    平均时间: all 2.95 0.00 1.64 5.40 0.00 90.02

    %user : 用户进程消耗CPU时间百分比

    %nice : 运行正常进程消耗CPU时间百分比

    %system : 系统进程消耗CPU时间百分比

    %iowait : IO等待多占用CPU时间百分比

    %steal : 内存在相对紧张坏经下pagein强制对不同页面进行的steal操作

    %idle : CPU处在空闲状态的时间百分比

    3. iostat [-c | -d] [-k] [-t] [-x [device]] [interval [count]]

    -c :显示CPU使用情况

    -d :显示磁盘使用情况

    -k : 每秒以k bytes为单位显示数据

    -t :打印出统计信息开始执行的时间

    -x device :指定要统计的磁盘设备名称,默认为所有磁盘设备

    interval :制定两次统计时间间隔

    count : 统计次数

    如: iostat -c

    user1@user1-desktop:~$ iostat -c

    Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)

    avg-cpu: %user %nice %system %iowait %steal %idle

    2.51 0.02 1.27 1.40 0.00 94.81

    (每项代表的含义与sar相同)

    4uptime ,如:

    user1@user1-desktop:~$ uptime

    10:13:30 up 1:15, 2 users, load average: 0.00, 0.07, 0.11

    显示的分别是:系统当前时间,系统上次开机到现在运行了多长时间,目前登录用户个数,系统在1分钟内、5分钟内、15分钟内的平均负载

    注意:load average的三个值一般不能大于系统CPU的个数,否则说明CPU很繁忙

    二 . 内存性能评估

    1free

    2.watch 与 free 相结合,在watch后面跟上需要运行的命令,watch就会自动重复去运行这个命令,默认是2秒执行一次,如:

    Every 2.0s: free Sat Mar 5 10:30:17 2011

    total used free shared buffers cached

    Mem: 2060496 1130188 930308 0 261284 483072

    -/+ buffers/cache: 385832 1674664

    Swap: 3000316 0 3000316

    (-n指定重复执行的时间,-d表示高亮显示变动)

    3.使用vmstat,关注swpd、si和so

    4. sar -r如:

    user1@user1-desktop:~$ sar -r 2 3

    Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)

    10时34分11秒 kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit

    10时34分13秒 923548 1136948 55.18 265456 487156 1347736 26.63

    10时34分15秒 923548 1136948 55.18 265464 487148 1347736 26.63

    10时34分17秒 923548 1136948 55.18 265464 487156 1347736 26.63

    平均时间: 923548 1136948 55.18 265461 487153 1347736 26.63

    kbmemfree : 空闲物理内存

    kbmemused : 已使用物理内存

    %memused : 已使用内存占总内存百分比

    kbbuffers : Buffer Cache大小

    kbcached : Page Cache大小

    kbcommit : 应用程序当前使用内存大小

    %commit :应用程序使用内存百分比

    三 . 磁盘I/O性能评估

    1sar -d ,如:

    user1@user1-desktop:~$ sar -d 1 3

    Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)

    10时42分27秒 DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util

    10时42分28秒 dev8-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

    10时42分28秒 DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util

    10时42分29秒 dev8-0 2.00 0.00 64.00 32.00 0.02 8.00 8.00 1.60

    10时42分29秒 DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util

    10时42分30秒 dev8-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

    平均时间: DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util

    平均时间: dev8-0 0.67 0.00 21.33 32.00 0.01 8.00 8.00 0.53

    DEV : 磁盘设备名称

    tps :每秒到物理磁盘的传送数,即每秒的I/O流量。一个传送就是一个I/O请求,多个逻辑请求可以被合并为一个物理I/O请求

    rc_sec/s:每秒从设备读入的扇区数(1扇区=512字节)

    wr_sec/s : 每秒写入设备的扇区数目

    avgrq-sz : 平均每次设备I/O操作的数据大小(以扇区为单位)

    avgqu-sz : 平均I/O队列的长度

    await : 平均每次设备I/O操作的等待时间(毫秒)

    svctm :平均每次设备I/O 操作的服务时间(毫秒)

    %util :一秒中有百分之几的时间用用于I/O操作

    正常情况下svctm应该小于await,而svctm的大小和磁盘性能有关,CPU、内存的负荷也会对svctm值造成影响,过多的请求也会简介导致svctm值的增加。

    await的大小一般取决与svctm的值和I/O队列长度以及I/O请求模式。如果svctm与await很接近,表示几乎没有I/O等待,磁盘性能很好;如果await的值远高于svctm的值,表示I/O队列等待太长,系统上运行的应用程序将变慢,此时可以通过更换更快的硬盘来解决问题。

    %util若接近100%,表示磁盘产生I/O请求太多,I/O系统已经满负荷地在工作,该磁盘可能存在瓶颈。长期下去,势必影响系统的性能,可通过优化程序或者通过更换更高、更快的磁盘来解决此问题。

    2. iostat -d

    user1@user1-desktop:~$ iostat -d 2 3

    Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)

    Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

    sda 5.89 148.87 57.77 1325028 514144

    Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

    sda 0.00 0.00 0.00 0 0

    Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

    sda 0.00 0.00 0.00 0 0

    Blk_read/s : 每秒读取的数据块数

    Blk_wrtn/s : 每秒写入的数据块数

    Blk_read : 读取的所有块数

    Blk_wrtn : 写入的所有块数

    如果Blk_read/s很大,表示磁盘直接读取操作很多,可以将读取的数据写入内存中进行操作;如果Blk_wrtn/s很大,表示磁盘的写操作很频繁,可以考虑优化磁盘或者优化程序。这两个选项没有一个固定的大小,不同的操作系统值也不同,但长期的超大的数据读写,肯定是不正常的,一定会影响系统的性能。

    3iostat -x /dev/sda 2 3 ,对指定磁盘的单独统计

    4vmstat -d

    四 . 网络性能评估

    1ping

    time值显示了两台主机之间的网络延时情况,若很大,表示网络的延时很大。packets loss表示网络丢包率,越小表示网络的质量越高。

    2netstat -i ,如:

    user1@user1-desktop:~$ netstat -i

    Kernel Interface table

    Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg

    eth0 1500 0 6043239 0 0 0 87311 0 0 0 BMRU

    lo 16436 0 2941 0 0 0 2941 0 0 0 LRU

    Iface : 网络设备的接口名称

    MTU : 最大传输单元,单位字节

    RX-OK / TX-OK : 准确无误地接收 / 发送了多少数据包

    RX-ERR / TX-ERR : 接收 / 发送数据包时产生了多少错误

    RX-DRP / TX-DRP : 接收 / 发送数据包时丢弃了多少数据包

    RX-OVR / TX-OVR : 由于误差而遗失了多少数据包

    Flg :接口标记,其中:

    L :该接口是个回环设备

    B : 设置了广播地址

    M : 接收所有的数据包

    R :接口正在运行

    U : 接口处于活动状态

    O : 在该接口上禁用arp

    P :表示一个点到点的连接

    正常情况下,RX-ERR,RX-DRP,RX-OVR,TX-ERR,TX-DRP,TX-OVR都应该为0,若不为0且很大,那么网络质量肯定有问题,网络传输性能也一定会下降。

    当网络传输存在问题时,可以检测网卡设备是否存在故障,还可以检查网络部署环境是否合理。

    3. netstat -r (default行对应的值表示系统的默认路由)

    4sar -n ,n后为DEV(网络接口信息)、EDEV(网络错误统计信息)、SOCK(套接字信息)、和FULL(显示所有)

    wangxin@wangxin-desktop:~$ sar -n DEV 2 3

    Linux 2.6.35-27-generic (wangxin-desktop) 2011年03月05日 _i686_ (2 CPU)

    11时55分32秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s

    11时55分34秒 lo 2.00 2.00 0.12 0.12 0.00 0.00 0.00

    11时55分34秒 eth0 2.50 0.50 0.31 0.03 0.00 0.00 0.00

    11时55分34秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s

    11时55分36秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00

    11时55分36秒 eth0 1.50 0.00 0.10 0.00 0.00 0.00 0.00

    11时55分36秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s

    11时55分38秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00

    11时55分38秒 eth0 14.50 0.00 0.88 0.00 0.00 0.00 0.00

    平均时间: IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s

    平均时间: lo 0.67 0.67 0.04 0.04 0.00 0.00 0.00

    均时间: eth0 6.17 0.17 0.43 0.01 0.00 0.00 0.00

    IFACE : 网络接口设备

    rxpck/s : 每秒接收的数据包大小

    txpck/s :每秒发送的数据包大小

    rxkB/s : 每秒接受的字节数

    txkB/s : 每秒发送的字节数

    rxcmp/s : 每秒接受的压缩数据包

    txcmp/s : 每秒发送的压缩数据包

    rxmcst/s : 每秒接受的多播数据包

    原文链接:http://blog.csdn.net/xiangqiao123/article/details/37659745


    安装 yum install -y sysstat

    sar -d 1 1

    rrqm/s: 每秒进行 merge 的读操作数目。即 delta(rmerge)/s
    wrqm/s: 每秒进行 merge 的写操作数目。即 delta(wmerge)/s
    r/s: 每秒完成的读 I/O 设备次数。即 delta(rio)/s
    w/s: 每秒完成的写 I/O 设备次数。即 delta(wio)/s
    rsec/s: 每秒读扇区数。即 delta(rsect)/s
    wsec/s: 每秒写扇区数。即 delta(wsect)/s
    rkB/s: 每秒读K字节数。是 rsect/s 的一半,因为每扇区大小为512字节。(需要计算)
    wkB/s: 每秒写K字节数。是 wsect/s 的一半。(需要计算)
    avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。delta(rsect+wsect)/delta(rio+wio)
    avgqu-sz: 平均I/O队列长度。即 delta(aveq)/s/1000 (因为aveq的单位为毫秒)。
    await: 平均每次设备I/O操作的等待时间 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)
    svctm: 平均每次设备I/O操作的服务时间 (毫秒)。即 delta(use)/delta(rio+wio)
    %util: 一秒中有百分之多少的时间用于 I/O 操作,或者说一秒中有多少时间 I/O 队列是非空的。即 delta(use)/s/1000 (因为use的单位为毫秒)

    如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘
    可能存在瓶颈。
    idle小于70% IO压力就较大了,一般读取速度有较多的wait.
    同时可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)

    另外还可以参考
    svctm 一般要小于 await (因为同时等待的请求的等待时间被重复计算了),svctm 的大小一般和磁盘性能有关,CPU/内存的负荷也会对其有影响,请求过多也会间接导致 svctm 的增加。await 的大小一般取决于服务时间(svctm) 以及 I/O 队列的长度和 I/O 请求的发出模式。如果 svctm 比较接近 await,说明 I/O 几乎没有等待时间;如果 await 远大于 svctm,说明 I/O 队列太长,应用得到的响应时间变慢,如果响应时间超过了用户可以容许的范围,这时可以考虑更换更快的磁盘,调整内核 elevator 算法,优化应用,或者升级 CPU。
    队列长度(avgqu-sz)也可作为衡量系统 I/O 负荷的指标,但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水。

    在命令行方式下,如何查看CPU、内存的使用情况,网络流量和磁盘I/O?

    Q: 在命令行方式下,如何查看CPU、内存的使用情况,网络流量和磁盘I/O?

     

    A: 在命令行方式下,

    1. 查看CPU使用情况的命令

    $ vmstat 5

    每5秒刷新一次,最右侧有CPU的占用率的数据

    $ top

    top 然后按Shift+P,按照进程处理器占用率排序

    2. 查看内存使用情况的命令

    $ free

    top 然后按Shift+M, 按照进程内存占用率排序

    $ top

    3. 查看网络流量

    可以用工具iptraf工具

    $ iptraf -g

    “”针对某个Interface的网络流量可以通过比较两个时间网络接口的RX和TX数据来获得

    $ date; ifconfig eth1

    $ date; ifconfig eth1

    4. 查看磁盘i/o

    $ iostat -d -x /dev/sdc3 2

    用iostat查看磁盘/dev/sdc3的磁盘i/o情况,每两秒刷新一次

    $ vmstat 2

    用vmstat查看io部分的信息

    procs:
    r–>;在运行队列中等待的进程数
    b–>;在等待io的进程数
    w–>;可以进入运行队列但被替换的进程

    memoy
    swap–>;现时可用的交换内存(k表示)
    free–>;空闲的内存(k表示)

    pages
    re--》回收的页面
    mf--》非严重错误的页面
    pi--》进入页面数(k表示)
    po--》出页面数(k表示)
    fr--》空余的页面数(k表示)
    de--》提前读入的页面中的未命中数
    sr--》通过时钟算法扫描的页面

    disk 显示每秒的磁盘操作。 s表示scsi盘,0表示盘号

    fault 显示每秒的中断数
    in--》设备中断
    sy--》系统中断
    cy--》cpu交换

    cpu 表示cpu的使用状态
    cs--》用户进程使用的时间
    sy--》系统进程使用的时间
    id--》cpu空闲的时间

    其中:
    如果 r经常大于 4 ,且id经常少于40,表示cpu的负荷很重。
    如果pi,po 长期不等于0,表示内存不足。
    如果disk 经常不等于0, 且在 b中的队列 大于3, 表示 io性能不好。


    【编辑推荐】

    正因为当初对未来做了太多的憧憬,所以对现在的自己尤其失望。生命中曾经有过的所有灿烂,终究都需要用寂寞来偿还。
  • 相关阅读:
    Poj(1459),最大流,EK算法
    Poj(3259),SPFA,判负环
    HDU(3790),最短路二级标准
    Poj(2349),最小生成树的变形
    CSUFT2016训练赛
    NYOJ(21),BFS,三个水杯
    Poj(3687),拓扑排序,
    Poj(2367),拓扑排序
    HDU(1856),裸的带权并查集
    HDU(1572),最短路,DFS
  • 原文地址:https://www.cnblogs.com/candlia/p/11920255.html
Copyright © 2011-2022 走看看