好吧,伙计们,抱歉我的问题可能比较愚蠢,但我对这个还很陌生。我被指派研究如何使用 Nagios 监控不同的服务,如果某个服务出现故障,尝试重新启动它并发送通知。Nagios 似乎是一款庞大的软件,而且我发现它的文档对我这样的新手来说不太友好……
我已经在 Debian 机器上成功安装了 Nagios,并且配置了 Web 界面,但现在我却很沮丧。
所以,我希望能够监控服务。我可以将所有的逻辑写成一个 Python 插件 - 我可以用 Python 编写一个命令行程序,它将读取 Nagios 提供的参数,返回状态代码、消息等,但我不知道该把这个插件放在哪里,如何配置它,以便 Nagios 知道它。
如果服务状态发生变化,我也不知道如何附加事件处理程序 - 以实现某些逻辑,例如重新启动服务等。
任何帮助都将不胜感激 - 我可能需要一个教程链接,只要给我指明方向就行了。
答案1
您想查看 Nagios 事件处理程序。以下是官方文档:
http://nagios.sourceforge.net/docs/3_0/eventhandlers.html
该页面上有一个重新启动进程的示例。