自建家庭服务器定期死机

自建家庭服务器定期死机

几年前,我搭建了一个家庭服务器,它周期性地死机并变得无响应。我完全不知道是什么原因造成的。我相信这是一个硬件问题,但我也不确定。我无法获得任何正确的诊断或日志文件……大多数时候它都会死机,并且不会留下任何错误的痕迹。在它死机的一百次中,有三次它会在屏幕上产生错误消息。我在这里附上了低分辨率手机相机拍摄的错误图片。常见的问题似乎是watchdog: BUG: soft lockup - CPU#3 stuck for 22s!

Imgur 错误图片专辑

请注意,我认为对 EmbyServer 的引用具有误导性。虽然我从未在它运行的情况下遇到过错误消息,但我在 emby 未运行(甚至 docker 也未运行,我的所有服务都在其中运行)的情况下也遇到过这种冻结。

我尝试了所有能找到的软件解决方案,包括尝试不同的 Linux 发行版(Debian 和 Ubuntu 服务器)。我尝试使用 kdump,但没有结果。我最初的设置使用了 m.2 ssd + hdd;我还将操作系统从 SSD 重新安装到了 HDD,没有任何变化。

在崩溃时,journalctl 日志中没有任何内容显示任何可疑内容。

此时,我准备假设我的 CPU(Ryzen 3 1200 3.1GHz 四核 AM4)坏了并且需要更换,但在我盲目开始购买新的硬件部件之前,我想先查看一下 Stack Exchange 社区,看看是否有什么您认为不对劲的地方。

相关内容