Nagios 测试超时设置问题

Nagios 测试超时设置问题

我使用 Nagios 监控另一台服务器上的 Oracle 安装。有时,某个特定测试(检查 Oracle 表空间是否可以分配下一个区)会失败,并显示“严重 - 插件 10 秒后超时”。

我要做的第一件事是弄清楚实际需要多长时间才能完成。如果是 11 秒,我可能不在乎,我只想将超时时间设置得稍微长一点。

我尝试设置 check_by_ssh 的超时时间,用于运行实际命令,如下所示:

define command {
  command_name    check_ssh_oracle_health
  command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C 
      "/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment 
      ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1 
      --connect=nagios/<pwd>@<SID> --timeout=15"
}

这没有任何效果;测试仍然出错,并且仍然说它在 10 秒后发生(是的,我确实重新启动了 Nagios:)。

我能看到的唯一其他可以设置超时的地方是在 nagios.cfg 中;这似乎太高级了(它会影响所有测试),此外,目前没有一个测试设置为 10 秒,所以我怀疑这不是正确的地方。

有什么指点吗?

答案1

我认为这是check_by_ssh超时(10 秒是此检查的默认超时时间),而不是它check_oracle_health内部的。尝试将的超时时间设置check_by_ssh为更高的值,看看是否仍会发生这种情况。

希望这可以帮助!

相关内容