在 Hetzner 上升级到 Centos Stream 导致内核崩溃

在 Hetzner 上升级到 Centos Stream 导致内核崩溃

我有几台 Hetzner AX 和 EX 系列(AMD 和 Intel)的服务器,我安装了 Centos 8,然后迁移到 Centos Stream,但每次我尝试使用 Stream 中的任何映像启动时,都会出现内核恐慌。
当然,他们并没有提供关于潜在内核配置的建议,只是声称没有已知问题(哈哈!)。由于它甚至没有进入日志记录,我几乎无能为力。
我已经在各种 PC 上进行了 10 次左右的 Stream 迁移,但我只在 HZ 服务器上遇到了问题。

有人对此有想法吗?

机器人截图

答案1

错误发生在amd64_edac_mod模块中。

您可以通过将模块添加到模块黑名单来禁用该模块

IE 中/etc/modprobe.d/edac_blacklist.conf

blacklist amd64_edac_mod

然后尝试重新启动并查看问题是否再次出现。

这会禁用 ECC 内存的机器检查异常支持,并可能导致无法获知是否发生了 ECC 错误。

鉴于这种情况发生在多个 hetzner 主机上,它很可能是与主板或主板上的内存控制单元有关的软件错误。

较新的内核可能确实会修复此问题,但我认为将该模块列入黑名单应该可以避免出现恐慌。

任何仍在线且已加载但未死亡的主机,您可能能够使用modprobe -r该模块来防止出现问题,但我建议先在不重要的主机上进行测试。

相关内容