zoukankan      html  css  js  c++  java
  • Linux top命令中CPU信息的详解(转)

    add by zhj: 下面的文章解释的很好了,这里再说明一下top命令中wa的含义,我们知道,当IO阻塞时,操作系统会把进程改为阻塞态,将CPU调度到运行其它进程。

    CPU在空闲状态下,会检查是否有阻塞的IO(磁盘或网络),如果有,那就认为是wa;如果没有,那才是真正的idle。在top命令中,85.1%id是真正的idle占比,而且有下面的公式

    us + sy + ni + id + wa + hi + si + st = 100%,当wa比较高时,比如超过30%时,说明IO读写很慢,用sudo iotop可以查看哪个进程点用的IO比例比较高。

    有两篇英文对wa进行了解释:

    http://veithen.github.io/2013/11/18/iowait-linux.html

    https://serverfault.com/questions/12679/can-anyone-explain-precisely-what-iowait-is

    原文:https://www.cnblogs.com/yjf512/p/3383915.html

    在使用top命令的时候会看到这么一行:

    Image(20)

    里面的各个值分别是什么意思呢?

    今天被问到这个问题,发现答的不是很清楚。果然啊,天天用最多的top命令都还没摸透。。。惭愧。。。于是就查了些资料:

    官方解释

    Cpu(s)表示的是cpu信息。各个值的意思是:

    us: user cpu time (or) % CPU time spent in user space

    sy: system cpu time (or) % CPU time spent in kernel space

    ni: user nice cpu time (or) % CPU time spent on low priority processes

    id: idle cpu time (or) % CPU time spent idle

    wa: io wait cpu time (or) % CPU time spent in wait (on disk)

    hi: hardware irq (or) % CPU time spent servicing/handling hardware interrupts

    si: software irq (or) % CPU time spent servicing/handling software interrupts

    st: steal time - - % CPU time in involuntary wait by virtual cpu while hypervisor is servicing another processor (or) % CPU time stolen from a virtual machine

    翻译一下:

    us:用户态使用的cpu时间比

    sy:系统态使用的cpu时间比

    ni:用做nice加权的进程分配的用户态cpu时间比

    id:空闲的cpu时间比

    wa:cpu等待磁盘写入完成时间

    hi:硬中断消耗时间

    si:软中断消耗时间

    st:虚拟机偷取时间

    好了,如果说列出上面的条条框框说我懂了,那真是自欺欺人了。下面是我自己的理解

    首先这个百分比是怎么算出来的呢?

    比如一秒内有100个cpu时间片,这个cpu时间片就是cpu工作的最小单位。那么这100个cpu时间片在不同的区域和目的进行操作使用,就代表这个区域所占用的cpu时间比。也就是这里得出的cpu时间百分比。

    比如下面一个程序:

    Image(21)

    将文件从磁盘的src位置拷贝到磁盘的dst位置。文件会从src先读取进入到内核空间,然后再读取到用户空间,然后拷贝数据到用户空间的buf上,再通过用户空间,内核空间,数据才到磁盘的dst上。

    所以从上面这个程序来看,cpu消耗在kernel space的时候就是sy(系统态使用的cpu百分比),cpu消耗在user space的时候就是us(用户态使用的cpu百分比)。

    好了,下面说说hi和si

    如果程序都没什么问题,那么是没有hi和si的,但是实际上有个硬中断和软中断的概念。比如硬中断,cpu在执行程序的时候,突然外设硬件(比如硬盘出现问题了)机器需要立刻通知cpu进行现场保存工作。这个时候会cpu会出现上下文切换。就是cpu会有一部分时间会被硬中断占用了,这个时间就是hi。相类似,si是软中断的cpu占用时间,软中断是由软件的指令方式触发的。

    相关软中断和硬中断的概念可以参考:

    http://blog.csdn.net/pxz_002/article/details/7327668

    下面是ni

    ni是nice的意思,nice是什么呢,每个linux进程都有个优先级,优先级高的进程有优先执行的权利,这个叫做pri。进程除了优先级外,还有个优先级的修正值。即比如你原先的优先级是20,然后修正值为-2,那么你最后的进程优先级为18。这个修正值就叫做进程的nice值。

    那么nice是一个进程的优先级修正值,为什么会占用cpu时间呢?

    ni是指用做nice加权的进程使用的用户态cpu时间比,我的理解就是一个进程的所谓修正值就意味着多分配一些cpu时间给这个进程的用户态,这个中间所多分配的cpu时间就是我们这里的ni。(这个理解没啥把握,如果有错误麻烦帮忙指出下)

    下面是wa

    wa指的是CPU等待磁盘写入完成的时间,就是说前提是要进行IO操作,在进行IO操作的时候,CPU等待时间。比如上面那个程序,最后一步,从系统空间到dst硬盘空间的时候,如果程序是阻塞的,那么这个时候cpu就要等待数据写入磁盘才能完成写操作了。所以这个时候cpu等待的时间就是wa。

    所以如果一台机器看到wa特别高,那么一般说明是磁盘IO出现问题,可以使用iostat等命令继续进行详细分析。

    下面是st

    st的名字很生动,偷取。。。是专门对虚拟机来说的,一台物理是可以虚拟化出几台虚拟机的。在其中一台虚拟机上用top查看发现st不为0,就说明本来有这么多个cpu时间是安排给我这个虚拟机的,但是由于某种虚拟技术,把这个cpu时间分配给了其他的虚拟机了。这就叫做偷取。

    id

    剩下的id就是除了上面那么多cpu处理上下文以外的cpu时间片。当然在这些时间片上,cpu是空闲的。

    top的所有这些cpu时间应该是相加为100%的。

    dstat

    题外话,有个dstat命令也是可以查看cpu的信息的。下图就是dstat -c的显示

    Image(22)

    其中可以很容易将usr和us,sys和sy,idl和id,wai和wa,hig和hi,siq和si对应起来

    但是可以观察到dstat是没有st,ni的统计的,而且它的所有部分加起来总和可能没有100,这就说明dstat实际是没有对st,ni做cpu统计的。使用的时候要注意下这个。

    参考文章:

    http://hi.baidu.com/higkoo/item/70600834426247483075a1df

    http://blog.csdn.net/codestinity/article/details/7496962

    http://book.51cto.com/art/200812/99435.htm

    http://unix.stackexchange.com/questions/18918/in-linux-top-command-what-are-us-sy-ni-id-wa-hi-si-and-st-for-cpu-usage

  • 相关阅读:
    递归
    递归
    递归
    San Francisco Crime Classification非数值性多分类问题
    kaggle入门题Titanic
    二叉树的前序,中序,后序,层序遍历的递归和非递归实现
    排序算法总结
    [LeetCode]148. Sort List链表归并排序
    [LeetCode]141. Linked List Cycle判断循环链表
    [leetcode]61. Rotate List反转链表k个节点
  • 原文地址:https://www.cnblogs.com/ajianbeyourself/p/8185973.html
Copyright © 2011-2022 走看看