zoukankan      html  css  js  c++  java
  • Centos 服务器系统内存故障排查

    该笔记主要记录一下如何排查指定服务器中的指定内存条是否损坏。

    1.内存故障排查

    因为 68 – 71 软SBC服务器都是Centos7系统,所以我们可以通过以下命令来排查内存是否出现损坏。

    grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow/ch*_ce_count

    1> count不为0表示有错误
    2> mc代表第几个cpu,
    3> csrow内存通道,
    4> ch第几个内存

    EDAC即error detection and correction(错误检测与纠正),是Linux系统内部的机制。在上面的日志中,可以清楚地看出是内存读错误。MC即memory controller(内存控制器)。CE则代表correctable error,是ECC内存中可以纠正的错误,相对地还有UE(uncorrectable error)。为了摸清是哪些内存出了问题,找出所有内存的CE计数,由上图可知,第四块内存出现了故障。

    通过 dmidecode -t memory 命令,可以查看每个DIMM

    2.CPU排查 cat /sys/devices/system/cpu/cpu*/online


    版权声明: 本博客,文章与代码均为学习时整理的笔记,博客中除去明确标注有参考文献的文章,其他文章【均为原创】作品,转载请务必【添加出处】,您添加出处是我创作的动力!

    警告:如果您恶意转载本人文章,则您的整站文章,将会变为我的原创作品,请相互尊重!
  • 相关阅读:
    开启MySQL远程访问权限 允许远程连接
    [SCOI2005]互不侵犯
    树的数据生成器
    博客园优化
    图的随机数据生成器
    CF 983B 序列函数
    [HNOI2010]弹飞绵羊
    luogu P3393 逃离僵尸岛
    LCT解读(1)
    [APIO2010]特别行动队
  • 原文地址:https://www.cnblogs.com/LyShark/p/15098682.html
Copyright © 2011-2022 走看看