Nagios 发送通知电子邮件时行为异常

Question

我觉得您的配置有点不对劲。如果检查不成功，Nagios 将每隔“retry_check_interval”（每次重试之间的时间）X“max_check_attempts”（连续失败次数）重新检查一次前它会发出警报，表示有东西坏了。在“HDD”检查过程中，这意味着硬盘需要处于非正常状态 2 小时前您会收到通知。如果检查应返回正常状态前如果满足上述条件，则不会发送失败通知。但是，您将收到恢复通知。对于“LOAD”检查，这种情况很可能会发生，即使 retry_check_interval 要小得多，因为系统使用情况通常非常动态。

此外，我不赞成将通知间隔设置为“0”——我觉得这是一种非常糟糕的做法，会导致错过警报，尤其是在 generic-* 模板上。我在模板中将我的间隔设置为“60”分钟，然后在那些我不想经常听到的少数检查中使用“240”分钟。

您还应该再次检查“hostgroup.cfg”文件。您在检查中定义的主机组未列在您的示例中的主机组配置文件中。

在 Nagios 3 及更高版本中：

“retry_check_interval” 更改为“retry_interval”

‘normal_check_interval’ 更改为 ‘check_interval’

也就是说，为了与旧版本的配置文件向后兼容，所有四个仍然受支持 - 即使在 Nagios 版本 4 中。

Answer 1