我想调整 nagios,以便对任何宕机节点停止所有检查(不显示服务或显示为未知)。换句话说,我只想看到宕机主机的一个警报,而不是 1(宕机)+ n(每个服务 1 个)。请注意,我感兴趣的是服务显示/状态,不仅仅是关闭通知。
原因:我们使用 nagios firefox/chrome 插件来监控状态,而 nagios 的行为太嘈杂,给出如下读数(因为每个节点都有 20 个服务):
3 down, 1 unreachable, 4 warnings, 87 critical
这意味着上行节点上的 7 个关键服务(问题出在服务上)被淹没在红色服务中,这些服务之所以关键,只是因为它们位于一个关闭/无法访问的节点上。我更希望看到的是:
3 down, 1 unreachable, 80 unknown, 4 warnings, 7 critical
甚至
3 down, 1 unreachable, 4 warnings, 7 critical
我查看了服务依赖关系,但没有找到一种描述方法:“使活动主机上的所有服务依赖于主机检查的状态”。
我发现讨论的问题 这里其中一名参与者认为这是 Nagios 的一个 bug,这里其中一名参与者认为它是“按照设计”的。
目前,我只对效果感兴趣,对设计理念则不感兴趣。请注意,这个 nagios 正在检查数百个节点,因此解决方案的可维护性也很重要。
TIA 和欢呼声。
答案1
你可以在使用最新版本(0.9.11)时隐藏它萼柱属,它是 Nagios/Icinga 的桌面(托盘)状态监视器:http://nagstamon.ifw-dresden.de/
答案2
您可以通过在状态 CGI 视图中应用过滤器来执行此操作...
Chrome/FF 插件只是从 CGI 中抓取数据,因此如果您将这些相同的过滤器添加到插件正在查询的状态 URL,您就可以控制它显示的内容。
例如,如果您只希望它看到主机:status.cgi?hostgroup=all&style=hostdetail
对于已启动的主机上的问题服务,仅:status.cgi?host=all&servicestatustypes=28&hoststatustypes=2
看这篇关于过滤器的博客文章有关要使用的特定值的更多信息。(它们是位字段。)
编辑:顺便说一句,当你选中这些框时,这正是 nagstamon 所做的事情。