服务器因看门狗而崩溃:BUG:每隔几天就会出现软锁定

服务器因看门狗而崩溃:BUG:每隔几天就会出现软锁定

几个月以来,我的 Ubuntu 服务器一直存在问题,每隔几天,机器就会锁定并且完全没有响应。我在 tty 中看到的唯一内容是反复出现以下消息,通常是在几个进程中的两个进程之间(PLEX 媒体服务器、SSHd、rtorrent、tmux 等...)

Mar 31 22:11:43 yggdrasil kernel: watchdog: BUG: soft lockup - CPU#2 stuck for 22s! [Plex DLNA Serve:23621]

我有时会看到一些其他信息,但在任何日志中都找不到它,journalctl 只有一个日志行实例,但当我重新启动时,tty 中却有几十个。

我已经更换了主板、GPU 和电源,但问题仍然存在。

规格如下:

  • 处理器:AMD Ryzen 5 1600X
  • 主板:华硕 ROG STRIX X370-F Gaming
  • 显卡:nVidia GT 210

还有其他方法可以让我彻底解决这个问题吗?当这种情况发生时,我是否应该尝试恐慌并获取内核内存转储?我该怎么做?

更新,早些时候发现了崩溃并看到了调用跟踪和更多信息:https://i.stack.imgur.com/pxTwc.jpg

相关内容