Nagios:关闭停机主机上的服务检查/显示

Nagios:关闭停机主机上的服务检查/显示

我想调整 nagios,以便对任何宕机节点停止所有检查(不显示服务或显示为未知)。换句话说,我只想看到宕机主机的一个警报,而不是 1(宕机)+ n(每个服务 1 个)。请注意,我感兴趣的是服务显示/状态,不仅仅是关闭通知。

原因:我们使用 nagios firefox/chrome 插件来监控状态,而 nagios 的行为太嘈杂,给出如下读数(因为每个节点都有 20 个服务):

3 down, 1 unreachable, 4 warnings, 87 critical

这意味着上行节点上的 7 个关键服务(问题出在服务上)被淹没在红色服务中,这些服务之所以关键,只是因为它们位于一个关闭/无法访问的节点上。我更希望看到的是:

3 down, 1 unreachable, 80 unknown, 4 warnings, 7 critical

甚至

3 down, 1 unreachable, 4 warnings, 7 critical

我查看了服务依赖关系,但没有找到一种描述方法:“使活动主机上的所有服务依赖于主机检查的状态”。

我发现讨论的问题 这里其中一名参与者认为这是 Nagios 的一个 bug,这里其中一名参与者认为它是“按照设计”的。

目前,我只对效果感兴趣,对设计理念则不感兴趣。请注意,这个 nagios 正在检查数百个节点,因此解决方案的可维护性也很重要。

TIA 和欢呼声。

答案1

你可以在使用最新版本(0.9.11)时隐藏它萼柱属,它是 Nagios/Icinga 的桌面(托盘)状态监视器:http://nagstamon.ifw-dresden.de/

在此处输入图片描述

答案2

您可以通过在状态 CGI 视图中应用过滤器来执行此操作...

Chrome/FF 插件只是从 CGI 中抓取数据,因此如果您将这些相同的过滤器添加到插件正在查询的状态 URL,您就可以控制它显示的内容。

例如,如果您只希望它看到主机:status.cgi?hostgroup=all&style=hostdetail

对于已启动的主机上的问题服务,仅:status.cgi?host=all&servicestatustypes=28&hoststatustypes=2

这篇关于过滤器的博客文章有关要使用的特定值的更多信息。(它们是位字段。)

编辑:顺便说一句,当你选中这些框时,这正是 nagstamon 所做的事情。

相关内容