watchdog/0 进程突然占用了我的所有 CPU

watchdog/0 进程突然占用了我的所有 CPU

我安装了全新安装的 Ubuntu 12.04,已经运行了大约一周。今天突然发现我的电脑每 5 秒就会死机一次。我重启了电脑,但仍然出现这种情况。我相信是名为 watchdog/0 的进程占用了所有资源。请参阅所附图片。

我该如何阻止这种情况?这样我几乎无法使用我的电脑。

空闲时 CPU 达到 100% 这是监视进程

更新

好吧,我刚刚进行了冷重启(关机、拔下电源、重新插入电源,然后开机),似乎问题已经解决了。查看了 watchdog 的手册页后,似乎该进程在重启期间可能会继续运行?所以它更像是软重启?我不知道为什么会发生这种情况。

答案1

以下是其功能的简要概述:

看门狗程序每十秒写入/dev/watchdog一次。如果设备已打开但一分钟内未写入,机器将重新启动。当内核内置“软件看门狗”支持(Debian 内核中的标准)时,此功能可用。

虽然它看起来很有用,但对于系统的可靠性来说并不是那么重要,而且它往往会导致不必要的唤醒,进而导致电池性能下降/您可以通过在nmi_watchdog=0内核启动参数中添加它来轻松地禁用它/etc/default/grub

答案2

我的服务器是戴尔 R320,12 核,看门狗严重消耗 CPU,平均 CPU 使用率为 68%。

将以下驱动程序添加到黑名单配置文件/etc/modprobe.d/blacklist.conf解决了我的问题

黑名单 acpi_pad
黑名单梅
黑名单 sb_edac
黑名单 i7core_edac

答案3

这可能与https://bugs.launchpad.net/ubuntu/+source/watchdog/+bug/1010855或者https://bugzilla.kernel.org/show_bug.cgi?id=42981

在我的系统上,重新启动可以解决该问题,但几个小时后问题又会出现。

答案4

点击此链接http://osdir.com/ml/ubuntu-bugs/2013-08/msg09026.html我做了以下事情:

1)删除(备份后)/lib/modules/3.13.0-24-generic/kernel/drivers/char/ipmi/ipmi_watchdog.ko

2)注释掉 /boot/config-3.13.0-24-generic 中包含“IPMI”和“watchdog”的行

现在问题似乎已经消失。

请注意,您可能需要使用终端中的命令将内核版本从 3.13.0-24-generic 更改uname -r为当前正在使用的内核。

相关内容