在 Nagios 3 中,我希望服务在处于严重状态 XX 分钟后升级。它对从正常状态变为严重状态的服务非常有效。但是,如果服务已发出警告 >XX 分钟(例如磁盘空间缓慢增加),并且变为严重状态,则第一次故障就会触发升级。它会将警告计数到升级计数,而我们希望它在 3 次严重警报后失败,而不是 3 次警告和一次严重警报。
是否有一种解决方案可以让我忽略服务检查升级计数的警告?
这是另一个具有同样问题和非常相似配置的用户的示例。http://copilotco.com/mail-archives/nagios-users.2009/msg00310.html)
答案1
由于我在我的实现中不使用升级,所以Nagios
我将盲目地谈论,仅关于服务升级定义文档。
您可能需要考虑该first_notification
指令:
首次通知: 此指令是一个数字,用于标识此升级生效的第一个通知。例如,如果您将此值设置为 3,则仅当服务处于非正常状态的时间足够长以致于发出第三个通知时,才会使用此升级。
并考虑该escalation_options
指令:
升级选项: 此指令用于定义确定何时使用此服务升级的标准。仅当服务处于此指令中指定的状态之一时才使用升级。如果服务升级中未指定此指令,则升级在所有服务状态下均视为有效。有效选项是以下一个或多个的组合:r = 在 OK(恢复)状态下升级,w = 在 WARNING 状态下升级,u = 在 UNKNOWN 状态下升级,以及 c = 在 CRITICAL 状态下升级。示例:如果您在此字段中指定 w,则仅当服务处于 WARNING 状态时才会使用升级。
因此,为了实现您想要的目标(3 次严重警报后升级),我会尝试这样的定义:
define serviceescalation{
host_name myhost
service_description Disk Usage
first_notification 3
last_notification 0
notification_interval 10
contact_groups admins
escalation_options c,r
}
希望它能够有所帮助...并且发挥作用...!