我安装了一个托管 Docker 容器的 Ubuntu 18.04.4 服务器,每隔几天系统就会崩溃,系统日志中会出现以下条目:
Jun 16 08:52:13 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#4 stuck for 23s! [containerd:1293]
Jun 16 08:52:41 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#4 stuck for 23s! [containerd:1293]
Jun 16 08:52:45 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#9 stuck for 22s! [rtorrent main:4407]
Jun 16 08:52:45 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#10 stuck for 22s! [runc:11721]
Jun 16 08:53:09 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#4 stuck for 23s! [containerd:1293]
Jun 16 08:53:13 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#9 stuck for 23s! [rtorrent main:4407]
Jun 16 08:53:13 shauls_home_server kernel: watchdog: BUG: soft lockup - CPU#10 stuck for 23s! [runc:11721]
我已经尝试过了这解决方案:添加nouveau.modeset=0
到 GRUB 的 Linux 行。
还有这个:echo 20 > /proc/sys/kernel/watchdog_thresh
,正如建议的那样这里。
这是我的Journalctl
日志就在事故发生前。
如果您能帮助我找出问题的原因,我将不胜感激。
答案1
BIOS
技嘉科技股份有限公司 A320M-H/A320M-H-CF
您的 BIOS 是 F40,日期是 2019 年 6 月 28 日。
有更新的 BIOS 可用,F50,日期为 2019 年 11 月 28 日,可以下载这里。
注意:请确认我拥有适合您型号的正确网页。
注意:更新 BIOS 之前请做好备份。
答案2
我有 Xeon CPU,并且遇到了完全相同的问题,导致它无法启动 Linux Mint 20 或 Windows 10。对我有帮助的是
bios > 芯片组 > 高级电源管理配置 > CPU C 状态控制 > 启用 CPU C3 报告并禁用 CPU C6 报告。
(我有一个基本的 AMI bios,你的路径可能会有所不同)