我该如何调试为什么 Munin 无法与 Nagios 通信?

我该如何调试为什么 Munin 无法与 Nagios 通信?

我已经关注指示将 Munin 连接到 Nagios。NSCA 已安装,echo -e "foo.example.com\ttest\t0\t0" | /usr/sbin/send_nsca -H localhost -c /etc/send_nsca.cfg以用户身份运行时可工作munin,并且我已将命令添加contacts nagioscontact.nagios.command /usr/bin/send_nsca -H your.nagios-host.here -c /etc/send_nsca.cfgMunin 配置中。

但是我在日志中没有收到任何 NSCA 消息。不是因为 Munin 端发送消息失败,也不是因为 Nagios 端接收消息失败。以下是我的问题:

  1. 我如何触发警报以便 Munin 进行测试?
  2. 我如何确定哪个步骤失败了?
  3. 如果 Munin 无法发送 NSCA 消息,我应该在日志中看到什么?
  4. 如果 Munin 成功发送消息,我应该在 Nagios 日志中看到什么?

答案1

从说明上看不是很清楚,但只有当 Nagios 是不是与 Munin 在同一台机器上运行,我看到您的 NSCA 正在发送到本地主机。这使得设置和调试变得更加容易。

1)我如何触发警报以便 Munin 进行测试?

不知道,但如果我发现一种快速的方法,我会调查并更新答案。

2)我如何确定哪个步骤失败了?

首先,确保您有以下几行nagios.cfg

accept_passive_service_checks=1
check_external_commands=1
command_file=/var/lib/nagios3/rw/nagios.cmd

为了进一步调试 Nagios 问题,请启用调试日志nagios.cfg

debug_level=256
debug_verbosity=2

重新启动 Nagios 服务并留意以下日志:

/var/log/nagios3/nagios.*
/var/log/munin/munin-*

您可以通过以下方式手动向特定主机和服务发送被动通知:

sudo -u nagios echo "[$(date +%s)] PROCESS_SERVICE_CHECK_RESULT;$host;$service;$result;$notes" >> $command_file

更多信息这里

相关内容