我有 centOS5,我在其中安装了 Nagios 监控系统 Ubuntu - 是远程主机,我在其中安装了 NRPE 插件和附加组件
现在在远程主机 UBUNUT 上--我的 NRPE.CFG 说
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 350 -c 500
command[check_http]=/usr/local/nagios/libexec/check_http -I 127.0.0.1 -w 150 -c 200
command[check_ssh]=/usr/local/nagios/libexec/check_ssh 127.0.0.1
CENTOS --HOST 有两个文件 localhost.cfg
define service{
use generic-service
host_name remotehost
service_description Total Processes
check_command check_nrpe!check_total_procs
}
define service{
use generic-service
host_name remotehost
service_description APACHE Processes
check_command check_nrpe!check_http 192.168.1.95
}
define service{
use generic-service
host_name remotehost
service_description SSH
check_command check_nrpe!check_ssh 127.0.0.1
}
和命令.cfg
# 'check_http' command definition
define command{
command_name check_http
command_line $USER1$/check_http -I $HOSTADDRESS$ $ARG1$
}
# 'check_ssh' command definition
define command{
command_name check_ssh
command_line $USER1$/check_ssh $ARG1$ $HOSTADDRESS$
}
进程命令已经存在,因此远程主机可以正常工作。
我自己添加了 http 和 ssh 的命令,但我不知道如何使用它,因为
对于进程,我可以理解 w 20 表示对超过 20 个进程发出警告,但是我如何将 w,c 用于 http 和 ssh。我很困惑,因为没有与之关联的数字。
另外,在使用 http 和 ssh 时我可以在哪里输入 IP 地址,因为使用上述数据,我的 http 可以通过点击和跟踪工作,但 shh 不起作用。它说使用正确
答案1
查看 check_http 和 check_ssh 的手册页。这两个检查通常直接从 nagios 服务器运行,并且不与 NRPE 一起使用(存在例外)。
警告和严重阈值与响应时间有关。您还可以修改可接受的 http 响应代码。
http://nagiosplugins.org/man/check_http http://nagiosplugins.org/man/check_ssh
请重新表述你的第二个问题,因为它目前没有意义。希望这能有所帮助
答案2
建议从另一台机器进行监控。如果你的一台机器断网,不仅主站点会瘫痪,而且你的警告系统也会瘫痪,而你却浑然不知。