我使用 Nagios 监控另一台服务器上的 Oracle 安装。有时,某个特定测试(检查 Oracle 表空间是否可以分配下一个区)会失败,并显示“严重 - 插件 10 秒后超时”。
我要做的第一件事是弄清楚实际需要多长时间才能完成。如果是 11 秒,我可能不在乎,我只想将超时时间设置得稍微长一点。
我尝试设置 check_by_ssh 的超时时间,用于运行实际命令,如下所示:
define command {
command_name check_ssh_oracle_health
command_line $USER1$/check_by_ssh -H $HOSTADDRESS$ -C
"/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment
ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1
--connect=nagios/<pwd>@<SID> --timeout=15"
}
这没有任何效果;测试仍然出错,并且仍然说它在 10 秒后发生(是的,我确实重新启动了 Nagios:)。
我能看到的唯一其他可以设置超时的地方是在 nagios.cfg 中;这似乎太高级了(它会影响所有测试),此外,目前没有一个测试设置为 10 秒,所以我怀疑这不是正确的地方。
有什么指点吗?
答案1
我认为这是check_by_ssh
超时(10 秒是此检查的默认超时时间),而不是它check_oracle_health
内部的。尝试将的超时时间设置check_by_ssh
为更高的值,看看是否仍会发生这种情况。
希望这可以帮助!