去年,我构建了一个自定义 Ubuntu 服务器,它托管多个 Docker 容器和一个带有 ZFS 的 8TB RAID 设置。但是,自 3 月以来,我每天至少会遇到一次完全随机的内核崩溃。我尝试了各种故障排除步骤,包括重新安装操作系统、禁用某些容器、使用更新前的内核、成功运行 MemTest 以及检查硬件,但到目前为止,这些步骤都没有奏效。我还拍了内核崩溃的照片,但我不知道如何解释它们。消息总是一样的:end kernel panic - not syncing: Fatal exception in interrupt
。我目前怀疑 CPU 可能有问题,但我愿意接受其他建议。有人能提供一些关于可能导致这些内核崩溃的原因的见解吗?感谢您的帮助!
操作系统:
- Ubuntu 22.04.2 LTS(GNU/Linux 5.15.0-60-通用 x86_64)
硬件:
- ASRock B550M Steel Legend AMD B550 So.AM4 双通道 DDR mATX 零售
- AMD Ryzen 5 4600G 6x 3.70GHz So.AM4 盒装
- 300 瓦特,安静无声!SFX Power 3
- 16GB (1x 16GB) G.Skill Aegis DDR4-2666 DIMM CL19-19-19-43 单条
- 2x 8TB Seagate Barracuda Compute ST8000DM004
答案1
重新排序同一个 CPU 后,我还没有遇到任何内核崩溃,这表明问题很可能出在 CPU 上。感谢大家的想法和支持!