我正在使用 nagios check_load 插件。
我的/etc/nagios/nrpe.cfg
command[check_load]=/usr/lib/nagios/plugins/check_load -w $ARG1$ -c $ARG2$
在我的 icinga 服务器上,/etc/icinga/objects/localhost_icinga.cfg
我有以下服务定义
define service{
use generic-service
host_name prod-01
service_description Prod Load
check_command check_nrpe!check_load!15,10,5!30,25,20
}
当我检查我的 icinga 仪表板时,它将此检查列为粉红色的未知错误。我需要更改配置中的哪些内容才能使一切正常运行?
答案1
尝试使用相同的参数在服务器上运行命令,看看它是否响应。它会告诉您错误,或者如果是未知错误,您只需要为用户 nagios 启用没有密码的 sudo 或 chmod 4755 和所有权 root:nagios 检查脚本。
答案2
在nrpe.cfg
您的目标系统上,是否dont_blame_nrpe
设置为 1?
您的 Icinga 服务器上的日志显示了什么?
答案3
您的 check_command 略有错误。您有check_nrpe!check_load!15,10,5!30,25,20
,它将“15,10,5”作为 ARG2 传递,将“30,15,20”作为 ARG3 传递,但您的命令被写入仅使用 ARG2。
您可以更改check_nrpe!check_load!15,10,5!30,25,20
为check_nrpe!check_load!"15,10,5 30,25,20"
(或更改您的command[check_load]
线路以同时使用 ARG2 和 ARG3)。