我有几台 Hetzner AX 和 EX 系列(AMD 和 Intel)的服务器,我安装了 Centos 8,然后迁移到 Centos Stream,但每次我尝试使用 Stream 中的任何映像启动时,都会出现内核恐慌。
当然,他们并没有提供关于潜在内核配置的建议,只是声称没有已知问题(哈哈!)。由于它甚至没有进入日志记录,我几乎无能为力。
我已经在各种 PC 上进行了 10 次左右的 Stream 迁移,但我只在 HZ 服务器上遇到了问题。
有人对此有想法吗?
答案1
错误发生在amd64_edac_mod
模块中。
您可以通过将模块添加到模块黑名单来禁用该模块
IE 中/etc/modprobe.d/edac_blacklist.conf
blacklist amd64_edac_mod
然后尝试重新启动并查看问题是否再次出现。
这会禁用 ECC 内存的机器检查异常支持,并可能导致无法获知是否发生了 ECC 错误。
鉴于这种情况发生在多个 hetzner 主机上,它很可能是与主板或主板上的内存控制单元有关的软件错误。
较新的内核可能确实会修复此问题,但我认为将该模块列入黑名单应该可以避免出现恐慌。
任何仍在线且已加载但未死亡的主机,您可能能够使用modprobe -r
该模块来防止出现问题,但我建议先在不重要的主机上进行测试。