守护进程失败并更改 pid 编号

守护进程失败并更改 pid 编号

proftpd、sshd 和 apache 进程在 Linux 发行版上使用 /etc/init.d/its-script 运行。

我使用 farm 监控服务监控 21、22 和 80 端口:服务每 5 分钟检查一次每个端口并仅通知故障。24 小时内故障次数为 5-6 次。有时似乎有人会踢开关。

我添加了 monit 和 collectd 监控,每 1 分钟监控一次 21、22 和 80 端口。我没有收到 farm 监控服务通知。我只收到有关 proftpd、sshd 或 apache 进程失败和/或成功/更改 pid 号的 monit 通知。24 小时内故障仍然有 5-6 次。collectd 监控 cpu、平均负载和每个进程都很正常,没有峰值。没有任何东西触发开关,但有一些东西决定了故障监控。这是一种简单的干扰还是表明存在某种异常?

什么可能导致这些失败?

答案1

这里要做的是开始深入研究系统日志,看看这些重启的原因是否与有趣的东西有关。可能是你遇到了 Linux 内存不足杀手,或者进程在崩溃时抛出了堆栈转储。这两者都会在系统日志中可见。

相关内容