需要帮助理解 NAGIOS NRPE 命令

需要帮助理解 NAGIOS NRPE 命令

我有 centOS5,我在其中安装了 Nagios 监控系统 Ubuntu - 是远程主机,我在其中安装了 NRPE 插件和附加组件

现在在远程主机 UBUNUT 上--我的 NRPE.CFG 说

command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 350 -c 500

command[check_http]=/usr/local/nagios/libexec/check_http -I 127.0.0.1 -w 150 -c 200
command[check_ssh]=/usr/local/nagios/libexec/check_ssh 127.0.0.1

CENTOS --HOST 有两个文件 localhost.cfg

define service{
                use                     generic-service
                host_name               remotehost
                service_description     Total Processes
                check_command           check_nrpe!check_total_procs
}



define service{
                use                     generic-service
                host_name               remotehost
                service_description     APACHE Processes
                check_command           check_nrpe!check_http 192.168.1.95
}

define service{
                use                     generic-service
                host_name               remotehost
                service_description     SSH
                check_command           check_nrpe!check_ssh 127.0.0.1
}

和命令.cfg

# 'check_http' command definition
define command{
        command_name    check_http
        command_line    $USER1$/check_http -I $HOSTADDRESS$ $ARG1$
        }


# 'check_ssh' command definition
define command{
        command_name    check_ssh
        command_line    $USER1$/check_ssh $ARG1$ $HOSTADDRESS$
        }

进程命令已经存在,因此远程主机可以正常工作。

我自己添加了 http 和 ssh 的命令,但我不知道如何使用它,因为

对于进程,我可以理解 w 20 表示对超过 20 个进程发出警告,但是我如何将 w,c 用于 http 和 ssh。我很困惑,因为没有与之关联的数字。

另外,在使用 http 和 ssh 时我可以在哪里输入 IP 地址,因为使用上述数据,我的 http 可以通过点击和跟踪工作,但 shh 不起作用。它说使用正确

答案1

查看 check_http 和 check_ssh 的手册页。这两个检查通常直接从 nagios 服务器运行,并且不与 NRPE 一起使用(存在例外)。

警告和严重阈值与响应时间有关。您还可以修改可接受的 http 响应代码。

http://nagiosplugins.org/man/check_http http://nagiosplugins.org/man/check_ssh

请重新表述你的第二个问题,因为它目前没有意义。希望这能有所帮助

答案2

建议从另一台机器进行监控。如果你的一台机器断网,不仅主站点会瘫痪,而且你的警告系统也会瘫痪,而你却浑然不知。

相关内容