内存日志中出现 CE 错误

内存日志中出现 CE 错误

我有 HP 服务器(DL360-G7),并在其上运行 Centos7 + cPanel。在 /var/log/message 中我看到此错误:

EDAC MC0: 5450 CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0

我更换了服务器上的 RAM 和内存插槽,但错误仍然存​​在:

EDAC MC0: 25509 CE error on CPU#0Channel#0_DIMM#0 (channel:0 slot:0

当我运行此命令时:

grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count

我看到这个输出:

/sys/设备/系统/edac/mc/mc0/csrow0/ch0_ce_count:5067071

/sys/设备/系统/edac/mc/mc1/csrow0/ch0_ce_count:0

ILO面板中没有任何错误!

有什么问题?

答案1

从上面的日志中我们可以知道错误是可纠正的错误,从 (channel:1 slot:0 和 channel:0 slot:0) 表示 2 个通道有问题(可纠正的问题)。通道是内存控制器通道,负责与一组 DIMM 进行通信。每个通道都有自己独立的控制(命令)和数据总线,可以独立使用或与其他通道组合使用。查看此页面https://www.kernel.org/doc/html/latest/driver-api/edac.html?highlight=edac#main-concepts-used-at-the-edac-subsystem。如果计数过高,最好更换 DIMM 并检查主板是否存在硬件错误,有时问题不是出在 DIMM 上,可能是出在主板本身上。您可以忽略 CE 错误计数过低的情况。

相关内容