当进程被 OOM Killer 杀死时如何发送通知警报?

当进程被 OOM Killer 杀死时如何发送通知警报?

因此,时不时地(一两个月一次)我们的一个进程,运行着我们不想触及的关键代码,被内存不足杀手杀死。中是这样说的/var/log/messages

我们要解决的是原因分别地。我想监控并解决效果现在。我希望我们(系统操作员)在发生这种情况时收到通知,以便我们可以等待一个小时左右,让集群上的流量稍微平息下来,然后重新启动被终止的任务。

我如何安排这样的通知发生?

我认为如果有必要的话,我们会在我们的机器上运行 Red Hat Linux。

相关内容