zoukankan      html  css  js  c++  java
  • Linux性能优化实战学习笔记:第五讲

    一、什么是CPU的使用率

    1、你最常用什么指标来描述系统的CPU性能?

    我想你的答案,可能不是平均负载,也不是CPU上下文切换,而是另一个更直观的指标CPU使用率

    CPU使用率到底是怎么算出来的吗?

    1、如何设置节拍率

    [root@luoahong ~]# grep 'CONFIG_HZ=' /boot/config-$(uname -r)
    CONFIG_HZ=1000

    2、内核提供的用户节拍率是多少?

    USER_HZ=100

    为了方便用户控件程序,内核还提供了一个用户控件的节拍率,它总是固定为100,也就是1/100秒,这样,用户控件程序并需要关系内核中HZ被设置成了多少

    4、如何查看用户控件系统内部状态信息

    [root@luoahong ~]#  cat /proc/stat | grep ^cpu
    cpu  62143 14 10857 931923 669 0 3498 0 0 0
    cpu0 31506 4 5649 467020 228 0 628 0 0 0
    cpu1 30637 10 5207 464903 441 0 2870 0 0 0
    [root@luoahong ~]#

    这里的输出结果是一个表格,其中,第一列表示的是CPU编号,如CPU0、CPU1,而第一行没有编号的CPU
    表示的是所有CPU的累加

    二、CPU使用率公式

    我们通常所说的 CPU使用率,就是除了空闲时间外的其他时间占总CPU时间的百分比,用公式来表示就是

    1、直接用/proc/stat 的数据,算的是什么时间段的 CPU使用率吗?

    看到这里,你应该想起来了,这是开机以来的节拍数累加值,所以直接算出来的,是开机以来的平均CPU使用率,一般没啥参考价值

    2、性能工具是如何计算CPU使用率的

    事实上,为了计算机CPU使用率,性能能工具一般都会间隔一段时间(比如 3 秒)的两次值,做差后,再计算出这段时间的平均CPU使用率 
    各种性能工具所看到的CPU使用率的实际计算方法如下

    性能分析工具给出的都是间隔一段时间的平均CPU使用率,所以要注意间隔时间的设置,特别是用多个工具对比分析时,

    你一定要保证他们用的是相同的间隔时间

    三、怎么查看CPU使用率

    1、top显示系统总体CPU使用情况

    top显示了系统总体的CPU和内存使用情况,以及各个进程的资源使用情况

    # 默认每 3 秒刷新一次
    $ top
    top - 11:00:25 up  1:35,  2 users,  load average: 0.00, 0.01, 0.18
    Tasks: 131 total,   1 running, 130 sleeping,   0 stopped,   0 zombie
    %Cpu(s):  0.0 us,  0.2 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.2 si,  0.0 st
    KiB Mem :  8056848 total,  5665852 free,   688220 used,  1702776 buff/cache
    KiB Swap:  2097148 total,  2097148 free,        0 used.  6945016 avail Mem
    
       PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
     10150 polkitd   20   0 1267680 201924   9372 S   1.0  2.5   0:39.33 mysqld
      9906 mysql     20   0 1119708 184904   5824 S   0.7  2.3   0:32.89 mysqld
      8041 root      20   0  300896   6384   4956 S   0.3  0.1   0:28.40 vmtoolsd
    
    ...

    2、top图解

    3、 pidstat分析每个进程CPU使用情况

    top并没有细分进程的用户态CPU和内核态CPU,那要怎么查看每个进程的详细情况呢?

    # 默认每 3 秒刷新一次
    $ top
    top - 11:00:25 up  1:35,  2 users,  load average: 0.00, 0.01, 0.18
    Tasks: 131 total,   1 running, 130 sleeping,   0 stopped,   0 zombie
    %Cpu(s):  0.0 us,  0.2 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.2 si,  0.0 st
    KiB Mem :  8056848 total,  5665852 free,   688220 used,  1702776 buff/cache
    KiB Swap:  2097148 total,  2097148 free,        0 used.  6945016 avail Mem
    
       PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
     10150 polkitd   20   0 1267680 201924   9372 S   1.0  2.5   0:39.33 mysqld
      9906 mysql     20   0 1119708 184904   5824 S   0.7  2.3   0:32.89 mysqld
      8041 root      20   0  300896   6384   4956 S   0.3  0.1   0:28.40 vmtoolsd
    
    ...
    Average:      999     10150    0.20    0.40    0.00    0.00    0.60     -  mysqld
    Average:        0     11747    0.40    1.59    0.00    0.00    1.98     -  pidstat

    4、pidstat命令图解

    最后的Average部分,还计算了5组数据的平均值

    四、CPU使用率过高怎么办?

    1、分析思路

    1、如何轻松找到CPU使用率过高的进程

    通过top、ps 、pidstat等工具

    2、占用CPU高的到底是代码里的那个函数?

    perf和GDB

    3、那么哪种工具适合在第一时间分析进程的 CPU 问题呢?

    perf是Linux 2.6.31 以后内置的性能分析工具,它以性能事件采样为基础,不仅可以分析系统的各种事件和内核性能,还可以用来分析制定应用程序的性能问题

    2、实时显示占用CPU时钟最多的函数

    实时显示占用CPU时钟最多的函数或者指令,因此可以用来查找热点函数

    [root@luoahong ~]# perf top
    
    Samples: 724 of event 'cpu-clock', Event count (approx.): 125711088
    Overhead Shared Object Symbol
    45.11% [kernel] [k] generic_exec_single
    ...

    采样数需要我们特别注意,如果采样数过少(比如只有十几个),那下面的排序和百分比就没什么实际参考价值了

    3、perf命令详解

    虽然实时展示了系统的性能信息,但它的缺点并不能保存数据,也就无法离线或者后续的分析,而perf record

    则提供了保存数据的功能,保存后的数据,需要你用perf report解析展示

    4、离线和后续分析占用CPU时钟最多的函数

    perf record # 按 Ctrl+C 终止采样
    
    [root@luoahong ~]# perf report
    
    Samples: 5K of event 'cpu-clock', Event count (approx.): 1332500000
    Overhead Command Shared Object Symbol
    97.15% swapper [kernel.kallsyms] [k] native_safe_halt
    0.49% swapper [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
    0.36% vmtoolsd libvmtools.so.0.0.0 [.] Backdoor_InOut
    0.34% swapper [kernel.kallsyms] [k] __do_softirq
    0.17% swapper [kernel.kallsyms] [k] tick_nohz_idle_exit
    0.13% swapper [kernel.kallsyms] [k] tick_nohz_idle_enter
    0.13% vmtoolsd [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
    0.11% kworker/0:1 [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
    0.11% vmtoolsd libvmtools.so.0.0.0 [.] BackdoorHbOut
    0.08% dockerd [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
    0.08% vmtoolsd [kernel.kallsyms] [k] __do_softirq
    0.06% kworker/1:2 [kernel.kallsyms] [k] queue_delayed_work_on
    0.06% vmtoolsd [kernel.kallsyms] [k] format_decode
    0.04% irqbalance [kernel.kallsyms] [k] cap_mmap_file
    0.04% kworker/0:0 [kernel.kallsyms] [k] ata_sff_pio_task
    0.04% kworker/1:2 [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
    0.04% mysqld mysqld [.] fts_optimize_words
    0.04% swapper [kernel.kallsyms] [k] rcu_idle_exit
    0.04% vmtoolsd libvmtools.so.0.0.0 [.] BackdoorHbIn
    0.02% dockerd [kernel.kallsyms] [k] __do_softirq
    0.02% in:imjournal rsyslogd [.] 0x0000000000016f90
    0.02% irqbalance [kernel.kallsyms] [k] __fsnotify_parent
    0.02% irqbalance [kernel.kallsyms] [k] _raw_spin_unlock_irqrestore
    0.02% irqbalance [kernel.kallsyms] [k] copy_user_generic_unrolled
    0.02% irqbalance [kernel.kallsyms] [k] native_flush_tlb_single
    0.02% irqbalance [kernel.kallsyms] [k] unmap_page_range
    Tip: For tracepoint events, try: perf report -s trace_fields

    在实际使用中,我们还经常为perf top和perf record加上-g参数,开启调用关系的采样,方便我们根据调用链分析西能问题

  • 相关阅读:
    Python全栈之路Day19
    Python全栈之路Day20
    Python全栈之路Day21
    子元素应该margin-top为何会影响父元素【转】
    HTML5的效果网站demo
    用CSS让字体在一行内显示不换行
    jQuery获得页面元素的绝对/相对位置
    DIV垂直/水平居中2(DIV宽度和高度是动态的)
    Jquery常用方法
    关于JS正则表达式
  • 原文地址:https://www.cnblogs.com/luoahong/p/10808031.html
Copyright © 2011-2022 走看看