我遇到的问题是,运行 icinga2 的主机之间的连接与实际检查的服务器计算机之间的连接有点......不确定。
因此,有时 - 每天几分钟,在不可预测的时间 - 所有主机和服务似乎都因冰卡而宕机。
我不想要它。我认为解决这个问题的最佳解决方案是,如果我能以某种方式建立一个最短停机时间,例如 10 分钟。
仅当停机时间长于该值时才应创建警报。
明显的副作用(警报出现延迟+缺乏对短暂网络停机的监控)对我来说不是问题。
答案1
您可以更改check_interval
并retry_interval
结合max_check_attempts
template Host "10mindowntime" {
max_check_attempts = 10
check_interval = 1m
retry_interval = 1m
}
十分钟结束后,您可以更改时间和尝试以适应您想要的任何粒度级别。