Nagios 3.x 中的节点发生故障,服务处于严重状态

Nagios 3.x 中的节点发生故障,服务处于严重状态

我想知道是否可以这样配置 Nagios 3.4.3:当节点关闭时,其相关服务将回答不可用(当然)。但是,在 nagios web 中,选择“主机组”,我可以看到节点处于关闭状态,但其服务处于紧急状态... 似乎服务尚未检查(当然是因为系统已关闭),但从视觉上看,服务似乎有问题,因为它们处于紧急状态。

这个配置,是我的配置有问题还是在Nagios中是正常的?

当节点关闭时,是否可以更改状态名称(非 CRITICAL)?

谢谢。

答案1

这个配置,是我的配置有问题还是在Nagios中是正常的?

这是正常的。这只是意味着 Nagios 在检测到主机宕机之前进行的最后一次服务检查返回了“严重”状态。

此 CRITICAL 服务结果可能触发了按需主机检查,导致 Nagios 发现主机已关闭,此时它开始抑制服务的通知。

当节点关闭时,是否可以更改状态名称(非 CRITICAL)?

不是,不是。除非你考虑到它是开源的,这意味着只要你愿意做一些修改,一切皆有可能。

听起来您真正寻找的是 Web 界面中针对主机/服务状态的各种“过滤器”选项。

答案2

看来您未能正确配置依赖项。服务应依赖于主机。还有一个继承依赖项标志,可使依赖项配置更加容易。

一个服务依赖另一个服务是很常见的,通常位于不同的主机上。需要添加这些依赖项。

由于中间路由器/主机/防火墙发生故障,主机可能无法访问。这些应添加到配置中。只需指定最后一跳依赖项。但是,您需要指定所有依赖项。Nagios 将对由于网络/服务器/服务中断而无法访问/失败的主机/服务做出适当的响应。

在发现主机停机之前,您的服务似乎处于“严重”状态。直到主机恢复后,这种情况才会消失。您可以通过重新配置来更改其状态。当服务的主机停机时,通常“严重”状态是正确的。当预计主机停机时,请使用计划停机。

相关内容