Linux系统出现了性能问题,一般我们可以通过top、iostat、free、vmstat等命令 来查看初步定位问题。其中iostat可以给我们提供丰富的IO状态数据。
iostat 由 Red Hat Enterprise Linux AS 发布。同时 iostat 也是 Sysstat 的一部分,可以下载到,网址是http://perso.wanadoo.fr/sebastien.godard/
执行 iostat 命令可以从系统启动之后的 CPU 平均时间,类似于 uptime。除此之外,iostat 还对创建一个服务器磁盘子系统的活动报告。该报告包含两部分:CPU 使用情况和磁盘使用 情况。
1. 基本使用
iostat [-c|-d] [-k] [-t] [间隔描述] [检测次数]
参 数:
-c : 仅显示cpu的状态
-d : 仅显示存储设备的状态,不可以和-c一起使用
-k : 默认显示的是读入读出的block信息,用-k可以改成KB大小来显示
-t : 显示日期
-p device | ALL : device为某个设备或者某个分区,如果使用ALL,就表示要显示所有分区和设备的信息
显示示例:
1: avg-cpu: %user %nice %sys %iowait %idle
2: 4.55 0.00 0.63 0.26 94.56
3:
4: Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
5: cciss/c0d0 30.11 68.20 67.13 1232784060 1213452142
6: cciss/c0d0p1 0.00 0.00 0.00 2531 2
7: cciss/c0d0p2 83.78 68.18 67.11 1232572011 1213204536
8: dm-0 1.06 0.60 4.07 10873201 73555720
9: dm-1 82.50 67.42 62.23 1218704309 1124966656
10: dm-2 0.21 0.18 0.83 3199605 14929540
11: dm-3 0.00 0.00 0.00 372 224
CPU 占用情况包括四块内容
%user:显示user level (applications)时,CPU的占用情况。
%nice:显示user level在 nice priority 时,CPU 的占用情况。
%sys: 显示 system level (kernel)时,CPU 的占用情况。
%idle: 显示CPU 空闲时间所占比例。
磁盘使用报告分成以下几个部分:
Device: 块设备的名字
tps: 该设备每秒 I/O 传输的次数。多个 I/O 请求可以组合为一个,每个 I/O 请求传输的字节数不同,因此可以将多个 I/O 请求合并为一个。
Blk_read/s, Blk_wrtn/s: 表示从该设备每秒读写的数据块数量。块的大小可以不同,如1024, 2048 或 4048 字节,这取决于 partition 的大小。
Blk_read, Blk_wrtn: 指示自从系统启动之后数据块读/写的合计数。也可以查看这几个文件/proc/stat,/proc/partitions,/proc/diskstats的内容。
2. -x 参数
使用-x参数我们可以获得更多统计信息。
1: iostat -d -x -k 1 10
2: Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
3: sda 1.56 28.31 7.80 31.49 42.51 2.92 21.26 1.46 1.16 0.03 0.79 2.62 10.28
4: Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
5: sda 2.00 20.00 381.00 7.00 12320.00 216.00 6160.00 108.00 32.31 1.75 4.50 2.17 84.20
rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的 时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);
wrqm/s:每秒这个 设备相关的写入请求有多少被Merge了。
rsec/s:每秒读取的扇区数;
wsec/: 每秒写入的扇区数。
r/s:The number of read requests that were issued to the device per second; 每秒对设备的读请求。
w/s:The number of write requests that were issued to the device per second; 每秒对设备的写请求。
await:每一个IO请求的处理的平均时间(单位是微秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。
%util:在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该 设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因 为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。
3. -c 参数
iostat还可以用来获取cpu部分状态值:
1: iostat -c 1 10
2: avg-cpu: %user %nice %sys %iowait %idle
3: 1.98 0.00 0.35 11.45 86.22
4: avg-cpu: %user %nice %sys %iowait %idle
5: 1.62 0.00 0.25 34.46 63.67
4. 常见用法
$iostat -d -k 1 10 #查看TPS和吞吐量信息
iostat -d -x -k 1 10 #查看设备使用率(%util)、响应时间(await)
iostat -c 1 10 #查看cpu状态
5. 实例分析
1: $$iostat -d -k 1 |grep sda10
2: Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
3: sda10 60.72 18.95 71.53 395637647 1493241908
4: sda10 299.02 4266.67 129.41 4352 132
5: sda10 483.84 4589.90 4117.17 4544 4076
6: sda10 218.00 3360.00 100.00 3360 100
7: sda10 546.00 8784.00 124.00 8784 124
8: sda10 827.00 13232.00 136.00 13232 136
上面看到,磁盘每秒传输次数平均约400;每秒磁盘读取约5MB,写入约1MB。
1: iostat -d -x -k 1
2: Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
3: sda 1.56 28.31 7.84 31.50 43.65 3.16 21.82 1.58 1.19 0.03 0.80 2.61 10.29
4: sda 1.98 24.75 419.80 6.93 13465.35 253.47 6732.67 126.73 32.15 2.00 4.70 2.00 85.25
5: sda 3.06 41.84 444.90 54.08 14204.08 2048.98 7102.04 1024.49 32.57 2.10 4.21 1.85 92.24
可以看到磁盘的平均响应时间<5ms,磁盘使用率>80。磁盘响应正常,但是已经很繁忙了。
如果想要对iostat检查多此,每次之间的间隔一定数量的秒数,这样就可以查看每几秒钟之内的io统计数 据,这对性能的测试才具有实际意义:
1: $> iostat -d 2 3
2: 表示没量秒钟检查一次,一共检查三次
3: avg-cpu: %user %nice %sys %iowait %idle
4: 4.55 0.00 0.63 0.26 94.56
5:
6: Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
7: cciss/c0d0 30.11 68.20 67.13 1232900288 1213456210
8: cciss/c0d0p1 0.00 0.00 0.00 2531 2
9: cciss/c0d0p2 83.78 68.19 67.11 1232688239 1213208604
10: dm-0 1.06 0.60 4.07 10873201 73558008
11: dm-1 82.50 67.42 62.23 1218820537 1124967604
12: dm-2 0.21 0.18 0.83 3199605 14930372
13: dm-3 0.00 0.00 0.00 372 224
14:
15: avg-cpu: %user %nice %sys %iowait %idle
16: 0.00 0.00 0.63 0.00 99.37
17:
18: Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
19: cciss/c0d0 1.02 0.00 63.27 0 124
20: cciss/c0d0p1 0.00 0.00 0.00 0 0
21: cciss/c0d0p2 15.82 0.00 63.27 0 124
22: dm-0 15.82 0.00 63.27 0 124
23: dm-1 0.00 0.00 0.00 0 0
24: dm-2 0.00 0.00 0.00 0 0
25: dm-3 0.00 0.00 0.00 0 0
26:
27: avg-cpu: %user %nice %sys %iowait %idle
28: 0.00 0.00 0.32 0.00 99.68
29:
30: Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
31: cciss/c0d0 3.06 0.00 26.53 0 52
32: cciss/c0d0p1 0.00 0.00 0.00 0 0
33: cciss/c0d0p2 6.63 0.00 26.53 0 52
34: dm-0 0.00 0.00 0.00 0 0
35: dm-1 6.63 0.00 26.53 0 52
36: dm-2 0.00 0.00 0.00 0 0
37: dm-3 0.00 0.00 0.00 0 0
其中每一次的统计都是上 一次的统计时间到这次的统计时间之间的统计数据
原文:http://www.cnblogs.com/txw1958/archive/2012/07/25/linux-iostat.html