确认主机/服务时的 check_mk 粘性注释是什么?

确认主机/服务时的 check_mk 粘性注释是什么?

我想将评论附加到使用 Nagios 监控的系统。我更喜欢使用 check_mk 作为 GUI。现在我偶然发现了这一点:我可以将评论设置为置顶和/或持久。

因此我询问我们的 Nagios 管理员粘性和持久性之间有什么区别。

事实证明,他不知道“粘性”——这必须是 check_mk 特有的东西。

经过 Google 和查看 check_mk 文档后,我没有找到有关该主题的任何信息。

那么:Nagios-service-comments 的粘性和持久性之间有什么区别?

更新:这是一张截图 - check_mk 快速搜索特定服务器,然后选择 hamer 符号。然后将显示以下内容:

截屏

问题是关于确认框:粘性与持久性

答案1

我会回答一些具体细节。Jenny D 说得很对,但我想更准确地说一下“不再报警”。

通常情况下,Nagios 会在每次状态改变时通知您:

  1. 因此,如果您的服务变为“警告”,您会收到通知。
  2. 您现在确认该服务,并且只要服务保持“警告”状态,就不会收到另一个(即定期)通知。
  3. 如果它移动到“CRIT”,您会收到通知。
  4. 如果它返回“警告”,您会收到通知。
  5. 如果结果显示“OK”,您将收到恢复通知。
  6. 此后,确认已过期,因为它变为“OK”

在粘性场景中,将不会有关于问题状态之间遍历的通知:

  1. 因此,如果您的服务变为“警告”,您会收到通知。
  2. 您现在已确认该服务已设置粘性选项。
  3. 如果它移动到“CRIT”,您将不会收到任何通知。
  4. 如果它返回“警告”,您将不会收到任何通知。
  5. 如果结果显示“OK”,您将收到恢复通知。
  6. 此后,粘性设置将被删除,因为它是确认的属性 - 由于它变为“OK”,因此已过期

从人类的角度来看:

不设置粘性选项意味着:我正在处理这个问题,但这需要一段时间,例如,虽然这只是一个警告,但我无权映射新磁盘。如果突然事情升级并且文件系统填满到 CRIT,我需要知道从那时起我们从主动维护转向紧急修复。

粘性选项允许您选择其他方式来处理。我正在处理这个问题,工作时会密切关注。在我工作期间,它可能会暂时恶化,直到我完成,然后就会好起来

仅供参考:如果您使用持久评论选项,确认信息将消失,但您输入的文本将保留

答案2

问题是关于确认框:粘性与持久性

好的,它们就是我在上面评论中描述的。看看更多细节:

  • 如果“sticky”选项设置为 1,确认将保留,直到主机恢复到 UP 状态。否则,当主机改变状态时,确认将自动被删除。

  • 如果“持久”选项设置为 1,则与确认相关的注释将在 Nagios 进程重新启动后继续存在。否则,注释将在下次 Nagios 重新启动时被删除。

答案3

这里的“粘性”是指“粘性确认”= 在该问题得到解决之前不会再发出警报。换句话说,即使同一故障不断产生警报,您已确认的事实也会一直存在。(当然,这种情况会持续到当前问题得到解决并且该问题不再产生警报为止 - 下次发生故障时,它会再次产生警报。)

相关内容