我在 Supermicro X8SIE-F 主板上运行 Xeon X3450。目前安装了 4 个常规 ECC DIMM(每个大小为 4GB;安装为 DIMM A-Channel1、DIMM A-Channel2、DIMM B-Channel1、DIMM B-Channel2 - 根据主板手册第 2-11 页)。
最近,记录了这个错误(仅此而已):
EDAC i7core: New Corrected error(s): dimm0: +0, dimm1: +0, dimm2 +3
因此我假设检测到 3 个可纠正错误。但是哪个 DIMM 受到影响了?
如果我运行:
find /sys/devices/system/edac/mc/mc0 -type f -name "*count" -exec cat {} \;
所有计数器均显示为 0。
但
cat /sys/devices/system/edac/mc/mc0/all_channel_counts/udimm2
显示 3 个错误。
列出了两个 csrow:csrow0、csrow1
csrow0 标签:
./ch0_dimm_label CPU#0Channel#0_DIMM#0
./ch1_dimm_label CPU#0Channel#1_DIMM#0
csrow1 标签:
./ch0_dimm_label CPU#0Channel#0_DIMM#1
./ch1_dimm_label CPU#0Channel#1_DIMM#1
我读
https://www.kernel.org/doc/html/v4.10/admin-guide/ras.html
但无法确定哪个 dimm 对应 all_channel_counts/udimm2。
任何帮助是极大的赞赏。
保罗