zoukankan      html  css  js  c++  java
  • 磁盘性能优化

    一、 查看硬盘读取速度

      命令:hdparm -t /dev/sda5

      打印:Timing buffered disk reads:  254 MB in  3.01 seconds =  84.34 MB/sec

      说明:能够指定具体的哪块硬盘进行查询的哦!

      二、 查找最耗iowait的进程

      操作步骤:

      1.  /etc/init.d/syslog stop

      2.  echo 1 > /proc/sys/vm/block_dump

      3.  dmesg | egrep "READ|WRITE|dirtied" | egrep -o '([a-zA-Z]*)' | sort | uniq -c | sort -rn | head

      不要忘记在抓完之后关掉block_dump和启动syslog

      4.  echo 0 > /proc/sys/vm/block_dump

      5.  /etc/init.d/syslog start

      三、 iostat命令

      格式:iostat [ -c | -d ] [ -k ] [ -t ] [ -V ] [ -x [ device ] ] [ interval

      描述:iostat是I/O statistics(输入/输出统计)的缩写,iostat工具将对系统的磁盘操作活动进行监视。它的特点是汇报磁盘活动统计情况,同时也会汇报出 CPU使用情况。同vmstat一样,iostat也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析。

      参数:

      -c为汇报CPU的使用情况;

      -d为汇报磁盘的使用情况;

      -k表示每秒按kilobytes字节显示数据;

      -p显示所有存储设备分区信息。

      -t为打印汇报的时间;

      -v表示打印出版本信息和用法;

      -x device指定要统计的设备名称,默认为所有的设备;

      interval指每次统计间隔的时间;

      count指按照这个时间间隔统计的次数。

      输出信息:

      rrqm/s: 每秒进行 merge 的读操作数目。即 delta(rmerge)/s

      wrqm/s: 每秒进行 merge 的写操作数目。即 delta(wmerge)/s

      r/s: 每秒完成的读 I/O 设备次数。即 delta(rio)/s

      w/s: 每秒完成的写 I/O 设备次数。即 delta(wio)/s

      rsec/s: 每秒读扇区数。即 delta(rsect)/s

      wsec/s: 每秒写扇区数。即 delta(wsect)/s

      rkB/s: 每秒读K字节数。是 rsect/s 的一半,因为每扇区大小为512字节。

      wkB/s: 每秒写K字节数。是 wsect/s 的一半。

      avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。即 delta(rsect+wsect)/delta(rio+wio)

      avgqu-sz: 平均I/O队列长度。即 delta(aveq)/s/1000 (因为aveq的单位为毫秒)。

      await: 平均每次设备I/O操作的等待时间 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)

      svctm: 平均每次设备I/O操作的服务时间 (毫秒)。即 delta(use)/delta(rio+wio)

      %util: 一秒中有百分之多少的时间用于 I/O 操作,或者说一秒中有多少时间 I/O 队列是  非空的。

      CPU:表示机器内所有的CPU;

      %user 表示CPU的利用率;

      %nice 表示CPU在用户层优先级的百分比,0表示正常;

      %system 表示当系统运行时,在用户应用层上所占用的CPU百分比;

      %iowait 表示请求硬盘I/0数据流出时,所占用CPU的百分比;

      %idle 表示空闲CPU百分比,值越大系统负载越低

      示例:

      avg-cpu:  %user   %nice    %sys  %iowait   %idle

      0.88       0.00    0.29    0.60   98.24

      我发现IO处理这块所占用的CPU的百分比要比较高啊。因为我正在做的就是记日志处理与MV更改名称所以CPU比较高!

      示例:

      1、    iostat -d -k 1 10

      Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn

      sda             121.00       356.00       888.00        356        888

      sda1         
    ;    0.00         0.00         0.00          0          0

      sda2              0.00         0.00         0.00          0          0

      sda3              0.00         0.00         0.00          0          0

      sda4              0.00         0.00         0.00          0          0

      sda5            243.00       356.00       888.00        356        888

      说明:

      -d    显示设备(磁盘)使用状态

      -k    某些使用block为单位的列强制使用kilobytes为单位

      Tps: 该设备每秒的传输次数(一次传输即一次IO请求)

      kB_read/s 每秒从设备读取的数据量

      kB_wrtn/s 每秒向设备写入的数据量

      kB_read      读取的总数据量

      kB_wrtn   写入的总数据量

      2、    iostat  -d -x -k 1 10

      Device:    rrqm/s wrqm/s   r/s   w/s  rsec/s  wsec/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  sv

      ctm  %util

      sda          2.00   0.00 15.00  0.00  600.00    0.00   300.00     0.00    40.00     0.25   15.53   7

      .20  10.80

      说明:rrqm/s 每秒这个设备相关的读取请求有多少被merge了(当系统调用需要读取数据的时候VFS会将请求发到各个FS,

      如果FS发现不同的读取请求读取的相同BLOCK的数据FS会将请求作一次合并);wrqm/s 每秒这个设备相关的写入请求有多少被merge了。

      Rsec/s 每秒读取的扇区数;wsec/s每秒写入的扇区数 r/s

      await:每一个IO请求的处理的平均时间(单位为微秒)说明:一般系统的IO响应时间应该低于5ms如果大于10ms就比较大了!

      %util:在统计时间内所有处理IO时间/总共统计时间    这个参数说明了设备的繁忙程序。如果此参数到了100%说明此设备接近満负荷运行

      (如果是多磁盘即使到了100%因为有并发也未必达到了瓶颈)

      3、iostat -c 1 10

      输出:

      avg-cpu:  %user   %nice    %sys %iowait   %idle

      65.30    0.00    1.61    2.23   30.86

      能够用来获取CPU的性能数据!

      实例分析:

      1、iostat -d -k 1|grep sda5

      输出:

      sda5              7.48        17.44        22.41  527084575  677241228

      sda5             20.79       380.20         0.00        384          0

      sda5            132.65       367.35       428.57        360        420

      sda5             39.60       582.18         0.00        588          0

      说明:其中的sda5表示的是物理逻辑分区而不是物理硬盘。如果有多块硬盘的话就表示为sda sdb 这样的多个物理硬盘

      2、iostat -d -x -k 1

      输出:

      Device:    rrqm/s wrqm/s   r/s   w/s  rsec/s  wsec/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util

      sda          0.05   6.46  1.85  2.43   35.34   71.15    17.67    35.57    24.87     0.10   22.25   6.20   2.66

      磁盘平均响应时间在22.25 磁盘的使用率在2.66%

      说明磁盘响应有点慢。

      四、vmstat

      名称:报告虚拟内存的统计信息

      格式:vmstat [-n] [延时[次数]]

      描述:这个命令是非常有用的务必要熟练掌握!

      选项:

      -n    开头令第一次的信息只显示一次而不是周期地产生

      -S    单位大小

      -a    显示活跃和不活跃的内存信息

      -s    显示相关虚拟内存统计表

      输出信息简介:

      Proc

      r:运行和等待(CPU时间片)运行的进程数,这个值也可以判断是否需要增加CPU(长期大于1)

      b:处于不可中断状态的进程数。常见情况由IO引起

      Memory

      swpd:切换到交换内存上的内存(默认以KB为单位)

      说明:如果它不为0或者比较大比如超过100M,但是si so 的值长期为0.这种情况不用担心系统性能

      free:空闲的物理内存

      buff:作为buffer cache的内存,对块设备的读写作缓冲

      cache:作page cache的内存,文件系统级的cache

      如果cache值大的时候说明cache住的文件数多,如果频繁访问到的文件都能被cache住那磁盘的读IO bi会非常小。

      Swap

      si: 交换内存使用,由磁盘调入内存

      so: 交换内存使用,由内存调入磁盘

      说明:如果系统的内存够用的时候这两个值都是0,如果这两个值长期大于0说明系统性能受到影响。

      如果系统的内存free 很少,但是si so也很少,那系统性能不会受到影响的!

      IO

      bi:从块设备读入的数据总量(读磁盘)(KB/s)

      bo:写入到块设备的数据总量(写磁盘)(KB/s)

      System

      in:    每秒产生的中断次数

      cs:    每秒产生的上下文切换次数

      说明:这两个值越大,会看到由内核消耗的CPU时间会越多!

      CPU

      us:    用户进程消耗的CPU时间百分比

      us的值比较高时,说明用户进程的消耗的CPU时间多,如果长期超过50%的使用那就要考虑优化程序算法或加速。

      sy    内核进程消耗的CPU时间百分比

      如果sy的值高时说明系统内核消耗的CPU资源多。要检查原因

      wa    IO等待消耗的CPU时间百分比

      wa值如果高时说明IO等待比较严重。可能是由于磁盘在做大量的随机访问造成,也可能是磁盘的带宽出现瓶颈

      id:    CPU处于空闲状态时间百分比

      情景分析:

      我们需要关心的有哪些方面?

      Procs r: 运行的进程比较多,系统很繁忙

      Io bo:   磁盘写的数据量稍大,如果是大文件的写,10M以内基本不用担心,如果是小文件写2M以内基本正常

      Cpu us:     持续大于50,如果是高峰期可以接受

      Cpu wa:     稍微有些高

      Cpu id:  持续小于50,高峰期可以接受

      五、TOP命令

      命令:top

      输出如下:

      top - 12:47:48 up 349 days, 21:50,  2 users,  load average: 3.81, 4.23, 4.34

      Tasks: 112 total,   1 running, 111 sleeping,   0 stopped,   0 zombie

      Cpu(s): 38.7% us,  0.6% sy,  0.0% ni, 58.9% id,  1.7% wa,  0.0% hi,  0.0% si

      Mem:   4147272k total,  4117996k used,    29276k free,   459344k buffers

      Swap:  1052248k total,      192k used,  1052056k free,  3174936k cached

      PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

      2274 root      15   0 24976  18m 2436 S   62  0.4 151:00.05 python

      第一行:top - 12:47:48 up 349 days, 21:50,  2 users,  load average: 3.81, 4.23, 4.34

      12:47:48        表示当前系统时间

      349 days, 21:50        表示系统启动后到现在的运作时间

      2 users            登录到用户的终端数。同一用户同一时间开多个终端认为是多个用户

      load average: 3.81, 4.23, 4.34    当前系统的平均负载,后面三个值分别为1分钟前、5分钟前、15分钟前进程的平均数

      一般可以认为这个数值超过CPU数目时CPU将比较吃力了!

      说明:查看当前服务器CPU数量的命令:cat /proc/cpuinfo |grep processor|wc -l    我的输出:8

      第二行:Tasks: 112 total,   1 running, 111 sleeping,   0 stopped,   0 zombie

      Tasks: 112 total    表示当前系统进程总数

      1 running        当前运行中的进程数

      111 sleeping        为当前等待状态中的进程数

      0 stopped        为被停止的系统进程数

      0 zombie        为僵死的进程数

      第三行:Cpu(s): 38.7% us,  0.6% sy,  0.0% ni, 58.9% id,  1.7% wa,  0.0% hi,  0.0% si

      显示CPU的利用率。如果有多个CPU按1就可以每行显示一个CPU的信息。

      第四行:Mem:   4147272k total,  4117996k used,    29276k free,   459344k buffers

      显示可用内存和已利用内存

      第五行:Swap:  1052248k total,      19

    2k used,  1052056k free,  3174936k cached

      注意:交换分区被频繁使用的话可以认为是物理内存不足而造成的。

      第六行开始列举各个进程的相关信息

      PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

      PID        进程ID

      USER        谁运行这个进程

      PRI        进程的优先级

      NI        nice值:这个值越高,任务的优先级越低

      SIZE        这个进程使用的内存(代码+数据+堆栈)

      RSS        这个进程占用的物理内存

      SHARE        这个进程使用的共享内存

      STAT        进程的状态信息。

      R    正在运行

      S    正在休息

      Z    迟滞

      T    停止

      W    已换出的进程

      N    正nice的值

      %CPU        这个进程占用的CPU百分比

      %MEM        占用的内存百分比

      TIME        这个进程使用的总CPU时间

      CPU        如果这是一个多处理器系统,这一列就表示其上运行进程的CPU的ID

      CPU Utilization,一个很直观的概念,在任意时间内,CPU有7个状态:

      1.idle,表示CPU闲置并等待工作分配.

      2.user,表示CPU在运行用户的进程

      3.system,表示CPU在执行kernel工作

      4.nice, 表示CPU花费在被nice改变过优先级的process上的时间

      (注意:被nice命令改变优先级的process仅指那些nice值为负的 process.花费在被nice命令改变优先级的任务上的时间也将被计算在系统和用户时间内,

      因此整个时间加起来可能会超过百分之百)

      5.iowait,表示CPU等待IO操作完成的时间

      6.irq,表示CPU开销在响应硬中断上的时间

      7.softirq,表示CPU开销在响应软中断上的时间.

      我们一般用vmstat看到的都是四个状态:sy,us,id,wa,通过他和load avg结合,基本可以知道cpu的状态

      us -> User         表示CPU在运行用户的进程

      sy -> system       表示CPU在执行kernel工作

      ni -> nice         表示CPU花费在被nice改变过优先级的process上的时间

      id -> idle         表示CPU闲置并等待工作分配.

      wa -> iowait       表示CPU等待IO操作完成的时间 %wa高,说明磁盘忙。譬如磁盘读写次数非常高。

      hi -> H/w interrupt requests  硬件中断

      si -> S/w interrupt requests  软件中断 %si高,是否说明软中断忙.进程之间频繁切换导致!

  • 相关阅读:
    循环队列
    UVa10000_Longest Paths(最短路SPFA)
    最新jhost免费jsp云空间会员邀请码
    Vertica: 基于DBMS架构的列存储数据仓库
    java中接口的定义与实现
    【C++知识汇总】运营商 & 运算符重载
    SVN与eclipse整合和利用、SVN与Apache综合
    Java单链逆转
    hdu1115(重力算法的多边形中心)
    高效C++规划
  • 原文地址:https://www.cnblogs.com/sysk/p/5219850.html
Copyright © 2011-2022 走看看