如何让 nagios 不将宕机的主机归类为未处理的问题?

如何让 nagios 不将宕机的主机归类为未处理的问题?

我在工作时间监控桌面。有些桌面一周只开机一两次。我已禁用这些桌面的主机通知,但主动检查仍然失败,并且“主机关闭”仍然在 nagios/multisite 中显示为未处理的问题。如何使主机关闭不是有问题吗?另外,我希望当主机关闭时,主动检查保持“正常”(最后状态)。

@Posipiet:我们所有的台式机都运行 Linux(Debian 或 Ubuntu),我想确保它们连接到互联网,没有待处理的更新,没有耗尽磁盘空间和内存等。我们的一些员工的技术水平不够,无法独自管理机器。我想在用户不知情的情况下收到警报、ssh 登录并修复它。但我不想在他们度假时收到垃圾邮件。

答案1

我不认为台式电脑应该由 Nagios 监控,但也许允许主机在 Nagios 监视下停机可以帮你。

答案2

也许你应该研究一下像 OCSinventory 这样的库存软件:http://www.ocsinventory-ng.org/en/

Nagios 并非用于监控不常开的系统。在这种情况下让它发挥作用总是一件很麻烦的事。

对于工作站,我们使用 OCSinventory,它还列出了磁盘空间等。对于服务器,我们使用 Icinga。

答案3

计划停机时间也许就是你想要的。

答案4

虽然我不太喜欢在 Nagios 中监控本质上不可靠的主机,但我有一个可行的解决方案。实施时风险自负。

在每个桌面上安装一个脚本,当机器正常关闭时,它会告诉 Nagios“我现在要走了,一切都好”,相反,当机器启动时,它会说“我回来了,请监视我”。如果您在客户端向 CGI 发出请求,您可以随意在服务器端定义任何您喜欢的机制。我可能会让该脚本完全禁用所有主机和服务检查,但您可以让它设置(非常长的)停机时间,或者任何您喜欢的停机时间。

如果人们有硬循环机器的习惯,那么这不起作用,但这是一个用户培训问题(因为即使没有 Nagios 平息脚本,你也不希望他们这样做)。

否则,考虑到您实际上只关心一些偶然的非服务(待处理更新、磁盘空间等),我可能会完全放弃主动检查,转而使用被动检查。这些更像是 SNMP 陷阱而不是主动监控,它们更适合 Nagios 模型。

相关内容