Linux kernel.panic 未按预期工作

Linux kernel.panic 未按预期工作

在过去的两个月里,我一直在调查与我的 Ubuntu VPS 的一些意外“冻结”相关的问题。

不知何故,我的 VPS 停止工作,进入不受控制的状态,只能通过手动重新启动机器来解决。

我认为该问题与内存泄漏有关,因此我决定将以下变量添加到 sysctl 来解决该问题:

# panic kernel on OOM
vm.panic_on_oom=1
# reboot after 10 sec on panic
kernel.panic=10

一开始我以为问题已经解决了(因为我认为问题与恐慌模式有关),但显然事实证明并没有。

这是我的 VPS 使用情况的图表,您可以看到 CPU 在几秒钟内达到 100%。

在此输入图像描述

我的第二次尝试是将 Monit 添加到我的 VPS 中,并使用一些规则来防止出现此类情况,方法是在使用一定的内存/CPU 后停止某些服务。但我没有解决。

我不明白问题出在哪里,当我的VPS处于不受控制的状态时,如何自动重新启动系统?

更新:

这是我的 Monit 配置示例:

if cpu usage > 50% for 2 cycles then alert
if cpu usage > 60% for 2 cycles then restart
if memory usage > 70% for 4 cycles then alert
if memory usage > 80% for 4 cycles then restart

相关内容