如果系统服务出现故障,则发送警报 centos

如果系统服务出现故障,则发送警报 centos

我想监控一组运行 centos 的主机上的系统服务。状态可以通过 systemctl 轻松获取,但有人知道在服务停止时(即服务状态不是“正在运行”)发送电子邮件的方法吗?

如果服务一次停机数小时,我希望避免发送数百封电子邮件,这可能意味着避免短期 cron 作业。如果服务停机,我可能只发送 1 封电子邮件,可能每小时发送 1 封,但即使这样也感觉很多。

我听说 Nagios、Zabbix 或 Kapacitor 可能适合这种情况,但我不确定哪个最适合解决此类问题。任何建议都会非常有帮助。

答案1

纳吉奥斯当 ping 没有返回时,向电子邮件地址发送电子邮件。您可以配置一系列选项;

check_period 24x7
check_interval 5
retry_interval 1
max_check_attempts 10
notification_period 24x7
notification_interval 30
notification_options d,u,r   

值得注意的是,您可以看到“通知间​​隔”选项,这是电子邮件警报之间的时间段选项。
最近我注意到他们添加了一个致谢系统,如果系统出现故障,您可以“确认”它,并且它将不再发送任何通知。

相关内容