我们正在使用基于 Nagios 的 Op5 来监控服务器。
我们是否也需要为服务器提供 Ping 服务,因为我猜测 host_check_live(command: $USER2$/check_host -H $HOSTADDRESS$)
命令已经使用 Ping 来查看它是否处于活动状态。
Ping 不是多余的吗?
答案1
至少在我的 NAGIOS 安装中,check_host-alive
实际运行check-ping
:
define command{
command_name check-host-alive
command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5
}
有两件事让我认为将其定义为独立于股票的支票check_ping
并非是多余的。
首先,这些阈值太高了。对于任何正常的服务器,我都不会对 2900 毫秒的 RTT 或 70% 的数据包丢失感到满意。这些阈值实际上只能用于测试服务器是否真的宕机。以下是当我真正关心值回到:
check_ping!200.0,20%!600.0,60%
因此有一个定量PING 检查主机可用性的方式与作为一项服务本身使用的方式之间存在差异,仅凭这一点就足以区分 ping-as-host-up-test 和 ping-as-link-quality-test。
其次,有些受监控的主机无法 PING 通,有时是出于我无法控制的原因。在这种情况下,我会对受监控的端口进行简单的 TCP 连接检查,或者在一种情况下traceroute 的输出。
编辑:我刚刚想到你可能会问“如果我们只是要再次 PING 主机以检查其是否正常运行,那么为什么要 PING 主机以检查其是否正常运行“。如果这是您的问题,那么上述原因 1 仍然适用。但是,我经常不关心 PING 作为服务检查 - 质量较差的链接将显示在受监控的许多其他服务中。因此,在大多数情况下,PING 并不是多余的。如果您不关心 PING 的输出(除了主机启动测试),也不要将其作为服务检查运行。
答案2
默认的 nagios 主机检查基于 ping。如果您已经为 ping 实现了单独的服务检查,那么这将是多余的。