Icinga 监控,随机“主机拒绝连接”

Icinga 监控,随机“主机拒绝连接”

我有一个 Nagios/icinga 监控系统,我用它来监控主要基于 Windows 的机器,这些机器运行着一个 NSClient++ 版本,我发现这个版本运行良好,而且不太烦人 (NSCP-0.4.1.105-x64)。它一直运行良好。

不过最近,我开始在随机服务上收到大量随机“主机拒绝连接”消息。通常每台机器只有一个服务,2 到 10 台机器都会抛出此错误。

这件事大概在一周前开始的。

通常,主机拒绝连接可能表示存在某种防火墙问题,甚至可能是超时。但事实上,在 10-15 个服务中,只有 1 个会报告此问题,并且可能在 2-3 分钟内就会检查为正常,这让事情变得非常烦人。

我尝试更新 NSclient 安装,也尝试通过增加回合计时器和超时来减轻 icinga 机器的负载,但负载并不特别高,约为 0.15

我知道我可以从哪里开始呢?

目前我有大约 40 台服务器和 200 个服务,其中 6 台报告一项服务“主机拒绝连接”,其中大约一半是物理机,另一半是虚拟机

答案1

最终导致监控服务器和主机对象之间的站点到站点 VPN 出现数据包丢失问题。

相关内容