我在不同的数据中心有两个 Nagios 服务器(监视器 A 和监视器 B)。我在两个服务器上都配置了相同的 WWW 主机。这一直运行良好,直到一个 Nagios 主机和 WWW 服务器之间出现网络问题。当出现网络问题时,我会收到大量关于 WWW 主机不可用的误报通知。问题 - 是否有某种分布式监控的解决方案?例如,如果监视器 A 和 WWW 服务器之间出现网络问题,则不会发送通知,直到监视器 B 上出现同样的问题?在此先感谢您的帮助。
答案1
正如 Zoredache 所说;我同意这并不是真正的假阳性。
您是否设置了父主机?如果设置了,Nagios 可以检测到宕机和无法访问之间的区别,然后您可以决定如何处理无法访问和宕机的情况。 http://nagios.sourceforge.net/docs/3_0/networkreachability.html
答案2
如果无法通过该网络访问您的网站,这听起来并不像是误报。但如果您没有以有用的方式设置依赖项/通知,您可能会收到无用的通知。
您能否设置检查来验证 nagios 实例和您的网站托管网络之间的网络链接是否良好?然后设置依赖项和通知,以便通知您 nagios 系统和之间的链接存在问题?
如果您正在监控正确的事情,您的 nagios 系统应该告诉您某个数据中心的 Internet 链接出现故障,而不是通知您由于网络链接中断而无法访问的所有服务。