zoukankan      html  css  js  c++  java
  • linux下如何获取cpu的利用率

    "proc文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间。它以文件系统的方式为访问系统内核数据的操作提供接口。用户和应用程序可以通过proc得到系统的信息,并可以改变内核的某些参数。"

        这里将介绍如何从/proc文件系统中获取与防火墙相关的一些性能参数,以及如何通过/proc文件系统修改内核的相关配置。

        1、从/proc文件系统获取相关的性能参数
        cpu使用率:    /proc/stat
        内存使用情况:      /proc/meminfo
        网络负载信息:    /proc/net/dev

    相应的计算方法:(摘自:什么是proc文件系统,见参考资料)
        (1)   处理器使用率   
        (2)   内存使用率   
        (3)   流入流出数据包   
        (4)   整体网络负载   
         这些数据分别要从/proc/stat、/proc/net/dev、/proc/meminfo三个文件中提取。如里有问题或对要提取的数据不太清楚,可以使用man   proc来查看proc文件系统的联机手册。   
        (1)   处理器使用率   
        这里要从/proc/stat中提取四个数据:用户模式(user)、低优先级的用户模式(nice)、内核模式(system)以及空闲的处理器时间(idle)。它们均位于/proc/stat文件的第一行。CPU的利用率使用如下公式来计算。   

    Total CPU time since boot = user+nice+system+idle+iowait+irq+softirq+steal

    %user = user / total.  注意:在top里,%user = (user + nice)/ total!
    Util = 100 - idle - iowait  - steal
    出处:https://github.com/Leo-G/DevopsWiki/wiki/How-Linux-CPU-Usage-Time-and-Percentage-is-calculated

       (2)   内存使用率   
        这里需要从/proc/meminfo文件中提取两个数据,当前内存的使用量(cmem)以及内存总量(amem)。   
        内存使用百分比   =   100   *   (cmem   /   umem)   
        (3)网络利用率   
        为了得到网络利用率的相关数据,需要从/proc/net/dev文件中获得两个数据:从本机输出的数据包数,流入本机的数据包数。它们都位于这个文件的第四行。   
        性能收集程序开始记录下这两个数据的初始值,以后每次获得这个值后均减去这个初始值即为从集群启动开始从本节点通过的数据包。   
        利用上述数据计算出网络的平均负载,方法如下:   
        平均网络负载   =   (输出的数据包+流入的数据包)   /   2
       
        2. 通过/proc文件系统调整相关的内核配置
        允许ip转发   /proc/sys/net/ipv4/ip_forward
        禁止ping    /proc/sys/net/ipv4/icmp_echo_ignore_all
       
        可以在命令行下直接往上述两个“文件”里头写入"1"来实现相关配置,如果写入"0"将取消相关配置。不过在系统重启以后,这些配置将恢复默认设置,所以,如果想让这些修改生效,可以把下面的配置直接写入/etc/profile文件,或者其他随系统启动而执行的程序文件中。
     
    echo 1 > /proc/sys/net/ipv4/ip_forward
    echo 1 > /proc/sys/net/ipv4/icmp_echo_ignore_all

        如果需要获取其他的性能参数,或者需要对内核进行更多的配置,可以参考下面链接中的proc文件系统介绍,也可以直接通过man proc查看相关的信息。

    参考资料和相关链接

    [1] 什么是proc文件系统
    http://blog.chinaunix.net/u1/37836/showart_304248.html
    [2] Linux下如何获取cpu的使用率
    http://topic.csdn.net/t/20060701/23/4855045.html
    [3] Exploring the /proc/net/ Directory
    http://www.linuxdevcenter.com/pub/a/linux/2000/11/16/LinuxAdmin.html?page=1
    [4] /proc/net introduction
    http://www.redhat.com/docs/manuals/enterprise/RHEL-4-Manual/en-US/Reference_Guide/s2-proc-dir-net.html
    [5] 使用ulimit和proc去调整系统参数
    http://www.linuxfly.org/post/73.htm

    注:文件里面是一个增量,每过一个时间间隔对应的项使用了CPU都会有增加,要算百分比,得用上上一次的状态值.

    这里计算cpu使用率是有问题的,需要使用上一状态的值来计算。
    返回

    elf 发表于 2007-11-16 09:06 #4

    正确的计算方法是,等上一个时间:

    1、记录某个时刻cpu的使用情况
    2、等上一个时间段
    3、再记录此刻的cpu使用情况
    4、计算总的时间片
    把第一次的所有cpu使用情况求和,得到j1
    把第二次的所有cpu使用情况求和,得到j2
    j2-j1得到这个时间段的所有时间片
    即total=j2-j1=第二次的所有列的和-第一次的所有列的和
    5、计算idle时间
    idle对应第五列的数据,用第二次的减去第一次的即可
    idle=第二次的第五列-第一次的第五列
    6、计算cpu使用率
    rate=(total-idle)/total

    见:http://oss.lzu.edu.cn/blog/article.php?tid_1379.html



    我们在搞性能测试的时候,对后台服务器的CPU利用率监控是一个常用的手段。服务器的CPU利用率高,则表明服务器很繁忙。如果前台响应时间越来越大,而后台CPU利用率始终上不去,说明在某个地方有瓶颈了,系统需要调优。这个是即使不懂技术的人都容易理解的事情。

    上面理解对吗?我个人觉得不十分准确。这个要看后台你测试的进程是什么类型的。如果是计算密集型的进程,当前端压力越来越大的时候,很容易把CPU利用率打上去。但是如果是I/O网络密集型的进程,即使客户端的请求越来越多,但是服务器CPU不一定能上去,这个是你要测试的进程的自然属性决定的。

    什么是CPU利用率呢?在Linux/Unix下,CPU利用率分为用户态,系统态和空闲态,分别表示CPU处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间。从计算机加电开始,CPU就一直忙个不停,所以CPU的利用率始终是100%。当没有用户进程需要执行的时候,CPU就执行系统缺省的空闲进程。我们所指的CPU利用率是指CPU执行非系统空闲进程的时间 / CPU总的执行时间。

    在Linux的内核中,有一个全局变量:Jiffies。 Jiffies代表时间。它的单位随硬件平台的不同而不同。系统里定义了一个常数HZ,代表每秒种最小时间间隔的数目。这样jiffies的单位就是 1/HZ。Intel平台jiffies的单位是1/100秒,这就是系统所能分辨的最小时间间隔了。每个CPU时间片,Jiffies都要加1。 CPU的利用率就是用执行用户态+系统态的Jiffies除以总的Jifffies来表示。

    在Linux系统中,CPU利用率的计算来源在/proc/stat文件,这个文件的头几行记录了每个CPU的用户态,系统态,空闲态等状态下的不同的Jiffies,常用的监控软件就是利用/proc/stat里面的这些数据来计算CPU的利用率的。
    包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累计到当前时刻。
    /proc/stat/
    [work@builder ~]$ cat /proc/stat
    cpu 432661 13295 86656 422145968 171474 233 5346
    cpu0 123075 2462 23494 105543694 16586 0 4615
    cpu1 111917 4124 23858 105503820 69697 123 371
    cpu2 103164 3554 21530 105521167 64032 106 334
    cpu3 94504 3153 17772 105577285 21158 4 24
    intr 1065711094 1057275779 92 0 6 6 0 4 0 3527 0 0 0 70 0 20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7376958 0 0 0 0 0 0 0 1054602 0 0 0 0 0 0 0 30 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
    ctxt 19067887
    btime 1139187531
    processes 270014
    procs_running 1
    procs_blocked 0


    输出解释
    CPU 以及CPU0、CPU1、CPU2、CPU3每行的每个参数意思(以第一行为例)为:
    参数 解释
    user (432661) 从系统启动开始累计到当前时刻,用户态的CPU时间(单位:jiffies) ,不包含 nice值为负进程。1jiffies=0.01秒
    nice (13295) 从系统启动开始累计到当前时刻,nice值为负的进程所占用的CPU时间(单位:jiffies)
    system (86656) 从系统启动开始累计到当前时刻,核心时间(单位:jiffies)
    idle (422145968) 从系统启动开始累计到当前时刻,除硬盘IO等待时间以外其它等待时间(单位:jiffies)
    iowait (171474) 从系统启动开始累计到当前时刻,硬盘IO等待时间(单位:jiffies) ,
    irq (233) 从系统启动开始累计到当前时刻,硬中断时间(单位:jiffies)
    softirq (5346) 从系统启动开始累计到当前时刻,软中断时间(单位:jiffies)

    CPU时间=user+system+nice+idle+iowait+irq+softirq

    “intr”这行给出中断的信息,第一个为自系统启动以来,发生的所有的中断的次数;然后每个数对应一个特定的中断自系统启动以来所发生的次数。
    “ctxt”给出了自系统启动以来CPU发生的上下文交换的次数。
    “btime”给出了从系统启动到现在为止的时间,单位为秒。
    “processes (total_forks) 自系统启动以来所创建的任务的个数目。
    “procs_running”:当前运行队列的任务的数目。
    “procs_blocked”:当前被阻塞的任务的数目。
     
    那么CPU利用率的计算方法:可以使用取两个采样点,计算其差值的办法。
    (idle2-idle1)/cpu2-cpu1
    附改进过后的shell
    代码
    1 #!/bin/sh
    2  
    3 #功能:计算CPU的利用率,选取采样点
    4 #计算公式:
    5 #方法1:cpu usage=(idle2-idle1)/(cpu2-cpu1)*100
    6 #方法2: cpu usage=[(user_2 +sys_2+nice_2) - (user_1 + sys_1+nice_1)]/(total_2 - total_1)*100
    7 #方法3:(本脚本采用)
    8 #total_0=USER[0]+NICE[0]+SYSTEM[0]+IDLE[0]+IOWAIT[0]+IRQ[0]+SOFTIRQ[0]
    9 #total_1=USER[1]+NICE[1]+SYSTEM[1]+IDLE[1]+IOWAIT[1]+IRQ[1]+SOFTIRQ[1]
    10 #cpu usage=(IDLE[0]-IDLE[1]) / (total_0-total_1) * 100
    11  
    12 ##echo user nice system idle iowait irq softirq
    13 CPULOG_1=$(awk '/\<cpu\>/{print $2""$3""$4""$5""$6""$7""$8}' /proc/stat)
    14 SYS_IDLE_1=$(echo $CPULOG_1| awk '{print $4}')
    15 Total_1=$(echo $CPULOG_1| awk '{print $1+$2+$3+$4+$5+$6+$7}')
    16
    17 sleep 5
    18
    19 CPULOG_2=$(awk '/\<cpu\>/{print $2""$3""$4""$5""$6""$7""$8}' /proc/stat)
    20 SYS_IDLE_2=$(echo $CPULOG_2| awk '{print $4}')
    21 Total_2=$(echo $CPULOG_2| awk '{print $1+$2+$3+$4+$5+$6+$7}')
    22
    23 SYS_IDLE=`expr $SYS_IDLE_2-$SYS_IDLE_1`
    24
    25 Total=`expr $Total_2-$Total_1`
    26
    27 #method 1
    28 #SYS_USAGE=`expr $SYS_IDLE/$Total*100 |bc -l`
    29 #SYS_Rate=`expr 100-$SYS_USAGE |bc -l`
    30
    31 #method2
    32 tmp_rate=`expr 1-$SYS_IDLE/$Total| bc -l`
    33 SYS_Rate=`expr $tmp_rate*100| bc -l`
    34
    35 #display
    36 Disp_SYS_Rate=`expr "scale=3; $SYS_Rate/1"|bc`
    37 echo $Disp_SYS_Rate%
  • 相关阅读:
    第4章:kubectl命令行管理工具
    Docker_CICD笔记
    Harbor镜像仓库
    centos7 安装最新的 wiki confluence
    Centos7.5使用SSH密钥登录
    一篇文章带你搞懂 etcd 3.5 的核心特性
    腾讯云边缘容器 TKE Edge 国内首批通过边缘容器技术能力认证
    揭秘有状态服务上 Kubernetes 的核心技术
    腾讯云云原生混合云-TKE发行版
    kubernetes 降本增效标准指南|理解弹性,应用弹性
  • 原文地址:https://www.cnblogs.com/sunss/p/1821986.html
Copyright © 2011-2022 走看看