zoukankan      html  css  js  c++  java
  • 【原创】谈谈线上CPU100%排查套路

    引言

    不知道在大家面试中,有没有遇到这个问题

    生产服务器上部署了几个java程序,突然出现了CPU100%的异常告警,你如何定位出问题呢?

    这个问题分为两版回答!
    高调版
    对不起,我是做研发的,这个问题在生产上是不可能遇见的!因为研发是不可能直接操作生产服务器,如果贵公司研发能遇到这个问题,应该要反思一下自己的权限控制是否合理!

    面试官心里活动:装13是不是,赶紧走!

    低调版
    这个问题我在生产上没碰到过,因为我们是没法直接操作生产环境的。只能说,在测试环境曾经遇见过。操作步骤如下,balabala...

    面试官心里活动:权限控制的不错,应该是在大厂呆过。

    下面开始我们的正文

    正文

    下面给出两种系统环节下的排查步骤,都是一模一样的,只是命令稍有区别!

    • 查消耗cpu最高的进程Pid
    • 根据Pid查出消耗cpu最高的线程号
    • 根据线程号查出对应的java线程,进行处理。

    准备一行死循环代码

    public class TestFor {
        public static void main(String[] args) {
            int random = 0;
            while (random < 100) {
                random = random * 10;
            }
        }
    }
    

    怎么跑,应该不用我说了,直接教大家怎么查!

    Windows版

    可能有人有疑问,我为什么要说Windows版的!因为,我曾经给很多政府部门做过系统。我发现他们用的是Windows Server,不是Linux系统。所有必要说一下!

    查消耗Cpu最高的进程PID

    手边没有Windows Server机器,我以Win 10为例,截图给大家看一下,先调出PID显示项!

    然后发现进程PID如下图所示,为10856

    接下来呢

    根据PID查出消耗Cpu最高的线程号

    这里用到微软的工具Process Explorer v16.22,地址如下
    https://docs.microsoft.com/zh-cn/sysinternals/downloads/process-explorer
    如图所示

    发现最耗Cpu的线程的TID6616
    这是十进制的数据,转成十六进制为0x19d8

    根据线程号查出对应的java线程,进行处理

    执行命令

    jstack -l 10856 > c:/10856.stack
    

    打开文件 c:/10856.stack,搜索19d8,如下图所示

    根据文件就可以看出,我们的TestFor.java文件第七行一直在跑,至此定位到问题

    Linux版

    Linux版本,步骤是一模一样的,就是命令换了一下

    查消耗Cpu最高的进程PID

    执行命令

    • 执行top -c ,显示进程运行信息列表。按下P,进程按照Cpu使用率排序

    如下图所示,PID3033的进程耗费Cpu最高

    根据Pid查出消耗Cpu最高的线程号

    执行命令

    • top -Hp 3033 ,显示一个进程的线程运行信息列表。按下P,进程按照Cpu使用率排序

    如下图所示,PID3034的线程耗费Cpu最高

    这是十进制的数据,转成十六进制为0Xbda

    根据线程号查出对应的java线程,进行处理

    jstack -l 3033 > ./3033.stack
    

    然后执行,grep命令,看线程0xbda做了什么

    cat 3033.stack |grep 'bda' -C 8
    

    输出如下

    至此定位到问题

    总结

    大家记得一定要去实际操作一次!

  • 相关阅读:
    echarts 算百分比与js toFixed算出来的百分比不一致的问题。
    VUE, Vue Router Tab 显示动态页签名称。
    [日常坑]前端j's数据导出excel,导出的文件损坏
    [最新 | Build 3211]Sublime Text 2.x, 3.x 许可License集合
    图片滤波
    electron-ipc通信性能分析
    设计vue3的请求实体工厂
    canvas-修改图片亮度
    canvas性能-drawImage渲染图片
    基于windows配置gitlab-runner
  • 原文地址:https://www.cnblogs.com/rjzheng/p/10315250.html
Copyright © 2011-2022 走看看