几个月以来,我的 Ubuntu 服务器一直存在问题,每隔几天,机器就会锁定并且完全没有响应。我在 tty 中看到的唯一内容是反复出现以下消息,通常是在几个进程中的两个进程之间(PLEX 媒体服务器、SSHd、rtorrent、tmux 等...)
Mar 31 22:11:43 yggdrasil kernel: watchdog: BUG: soft lockup - CPU#2 stuck for 22s! [Plex DLNA Serve:23621]
我有时会看到一些其他信息,但在任何日志中都找不到它,journalctl 只有一个日志行实例,但当我重新启动时,tty 中却有几十个。
我已经更换了主板、GPU 和电源,但问题仍然存在。
规格如下:
- 处理器:AMD Ryzen 5 1600X
- 主板:华硕 ROG STRIX X370-F Gaming
- 显卡:nVidia GT 210
还有其他方法可以让我彻底解决这个问题吗?当这种情况发生时,我是否应该尝试恐慌并获取内核内存转储?我该怎么做?
更新,早些时候发现了崩溃并看到了调用跟踪和更多信息:https://i.stack.imgur.com/pxTwc.jpg