无法让 ECC 错误报告在 Linux 中工作

无法让 ECC 错误报告在 Linux 中工作

我一直在尝试让 ECC 错误报告在 Debian 11 中正常工作,但没有成功。硬件配置如下:

  • 主板:华擎 X570 Pro4
  • CPU:锐龙7 PRO 5750G
  • 内存:金士顿 KSM26ED8/32ME (x2)

所有这些都支持ECC,并且在UEFI设置中也启用了ECC。

以下是我尝试过的一些命令:

# dmesg | grep -i edac
[    0.331589] EDAC MC: Ver: 3.0.0

# edac-util --status
edac-util: EDAC drivers loaded. No memory controllers found

# lsmod | grep edac
edac_mce_amd           32768  0

# ls /sys/devices/system/edac/mc
power  subsystem  uevent

# modprobe amd64_edac_mod 
modprobe: ERROR: could not insert 'amd64_edac_mod': No such device

# modprobe amd64_edac_mod ecc_enable_override=1
modprobe: ERROR: could not insert 'amd64_edac_mod': No such device

# ras-mc-ctl --status
ras-mc-ctl: drivers not loaded.

还有什么我可以尝试的吗?

编辑

@sup 引用的内核补丁修复了该问题:https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=0b8bf9cb142da59a14622bba168ebcd6d0a54499

它从版本 5.17-rc1 开始包含在主线内核中。

相关内容