磁盘性能优化

　　打印：Timing buffered disk reads: 254 MB in 3.01 seconds = 84.34 MB/sec

　　格式：iostat [ -c | -d ] [ -k ] [ -t ] [ -V ] [ -x [ device ] ] [ interval

　　描述：iostat是I/O statistics（输入/输出统计）的缩写，iostat工具将对系统的磁盘操作活动进行监视。它的特点是汇报磁盘活动统计情况，同时也会汇报出 CPU使用情况。同vmstat一样，iostat也有一个弱点，就是它不能对某个进程进行深入分析，仅对系统的整体情况进行分析。

　　rkB/s: 每秒读K字节数。是 rsect/s 的一半，因为每扇区大小为512字节。

　　avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。即 delta(rsect+wsect)/delta(rio+wio)

　　avgqu-sz: 平均I/O队列长度。即 delta(aveq)/s/1000 (因为aveq的单位为毫秒)。

　　await: 平均每次设备I/O操作的等待时间 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)

　　svctm: 平均每次设备I/O操作的服务时间 (毫秒)。即 delta(use)/delta(rio+wio)

　　%util: 一秒中有百分之多少的时间用于 I/O 操作，或者说一秒中有多少时间 I/O 队列是非空的。

　　%system 表示当系统运行时，在用户应用层上所占用的CPU百分比；

　　%iowait 表示请求硬盘I/0数据流出时，所占用CPU的百分比；

　　我发现IO处理这块所占用的CPU的百分比要比较高啊。因为我正在做的就是记日志处理与MV更改名称所以CPU比较高！

　　Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await sv

　　说明：rrqm/s 每秒这个设备相关的读取请求有多少被merge了（当系统调用需要读取数据的时候VFS会将请求发到各个FS，

　　如果FS发现不同的读取请求读取的相同BLOCK的数据FS会将请求作一次合并）；wrqm/s 每秒这个设备相关的写入请求有多少被merge了。

　　await:每一个IO请求的处理的平均时间（单位为微秒）说明：一般系统的IO响应时间应该低于5ms如果大于10ms就比较大了！

　　%util:在统计时间内所有处理IO时间/总共统计时间这个参数说明了设备的繁忙程序。如果此参数到了100%说明此设备接近満负荷运行

　　（如果是多磁盘即使到了100%因为有并发也未必达到了瓶颈）

　　说明：其中的sda5表示的是物理逻辑分区而不是物理硬盘。如果有多块硬盘的话就表示为sda sdb 这样的多个物理硬盘

　　Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util

　　sda 0.05 6.46 1.85 2.43 35.34 71.15 17.67 35.57 24.87 0.10 22.25 6.20 2.66

　　r:运行和等待（CPU时间片）运行的进程数，这个值也可以判断是否需要增加CPU（长期大于1）

　　说明：如果它不为0或者比较大比如超过100M，但是si so 的值长期为0.这种情况不用担心系统性能

　　如果cache值大的时候说明cache住的文件数多，如果频繁访问到的文件都能被cache住那磁盘的读IO bi会非常小。

　　说明：如果系统的内存够用的时候这两个值都是0，如果这两个值长期大于0说明系统性能受到影响。

　　如果系统的内存free 很少，但是si so也很少，那系统性能不会受到影响的！

　　说明：这两个值越大，会看到由内核消耗的CPU时间会越多！

　　us的值比较高时，说明用户进程的消耗的CPU时间多，如果长期超过50%的使用那就要考虑优化程序算法或加速。

　　如果sy的值高时说明系统内核消耗的CPU资源多。要检查原因

　　wa值如果高时说明IO等待比较严重。可能是由于磁盘在做大量的随机访问造成，也可能是磁盘的带宽出现瓶颈

　　Io bo: 磁盘写的数据量稍大，如果是大文件的写，10M以内基本不用担心，如果是小文件写2M以内基本正常

　　top - 12:47:48 up 349 days, 21:50, 2 users, load average: 3.81, 4.23, 4.34

　　第一行：top - 12:47:48 up 349 days, 21:50, 2 users, load average: 3.81, 4.23, 4.34

　　2 users 登录到用户的终端数。同一用户同一时间开多个终端认为是多个用户

　　load average: 3.81, 4.23, 4.34 当前系统的平均负载，后面三个值分别为1分钟前、5分钟前、15分钟前进程的平均数

　　说明：查看当前服务器CPU数量的命令：cat /proc/cpuinfo |grep processor|wc -l 我的输出：8

　　第二行：Tasks: 112 total, 1 running, 111 sleeping, 0 stopped, 0 zombie

　　第三行：Cpu(s): 38.7% us, 0.6% sy, 0.0% ni, 58.9% id, 1.7% wa, 0.0% hi, 0.0% si

　　显示CPU的利用率。如果有多个CPU按1就可以每行显示一个CPU的信息。

　　第四行：Mem: 4147272k total, 4117996k used, 29276k free, 459344k buffers

2k used, 1052056k free, 3174936k cached

　　注意：交换分区被频繁使用的话可以认为是物理内存不足而造成的。

　　第六行开始列举各个进程的相关信息

　　PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

　　PID 进程ID

　　USER 谁运行这个进程

　　PRI 进程的优先级

　　NI nice值：这个值越高，任务的优先级越低

　　SIZE 这个进程使用的内存（代码+数据+堆栈）

　　RSS 这个进程占用的物理内存

　　SHARE 这个进程使用的共享内存

　　STAT 进程的状态信息。

　　R 正在运行

　　S 正在休息

　　Z 迟滞

　　T 停止

　　W 已换出的进程

　　N 正nice的值

　　%CPU 这个进程占用的CPU百分比

　　%MEM 占用的内存百分比

　　TIME 这个进程使用的总CPU时间

　　CPU 如果这是一个多处理器系统，这一列就表示其上运行进程的CPU的ID

　　CPU Utilization,一个很直观的概念,在任意时间内,CPU有7个状态:

　　1.idle,表示CPU闲置并等待工作分配.

　　2.user,表示CPU在运行用户的进程

　　3.system,表示CPU在执行kernel工作

　　4.nice, 表示CPU花费在被nice改变过优先级的process上的时间

　　(注意:被nice命令改变优先级的process仅指那些nice值为负的 process.花费在被nice命令改变优先级的任务上的时间也将被计算在系统和用户时间内,

　　因此整个时间加起来可能会超过百分之百)

　　5.iowait,表示CPU等待IO操作完成的时间

　　6.irq,表示CPU开销在响应硬中断上的时间

　　7.softirq,表示CPU开销在响应软中断上的时间.

　　我们一般用vmstat看到的都是四个状态:sy,us,id,wa,通过他和load avg结合，基本可以知道cpu的状态

　　us -> User 表示CPU在运行用户的进程

　　sy -> system 表示CPU在执行kernel工作

　　ni -> nice 表示CPU花费在被nice改变过优先级的process上的时间

　　id -> idle 表示CPU闲置并等待工作分配.

　　wa -> iowait 表示CPU等待IO操作完成的时间 %wa高，说明磁盘忙。譬如磁盘读写次数非常高。

　　hi -> H/w interrupt requests 硬件中断

　　si -> S/w interrupt requests 软件中断 %si高，是否说明软中断忙.进程之间频繁切换导致！