NSclient++ NRPE 问题

NSclient++ NRPE 问题

我已经将 NSclient++ 与 Nagios 配合使用一段时间了。最近,出于纯粹的好奇心,我开始测试 Nagwin,看看它是如何工作的。我停止使用主 Nagios 配置检查测试服务器,将 NSclient++ 设置为 NRPE 模式,并将 Nagwin 指向它。它工作了几个小时,然后突然开始看到“未知:该命令没有处理程序”。我认为这一定是 Nagwin 的问题,因为它太新了,我只需卸载 NRPElistner.dll 并返回到由 check_NT 监控的服务器即可。但是现在 check_NT 不工作了,我的主要 Nagios 服务器返回超时错误并且根本无法连接。我的 Nagwin 服务器可以连接到它,但服务器不知道如何处理 check_NRPE 命令,尽管几个小时前它没有任何变化。

我已经研究了一天,并且相当确定这是 NSclient++ 的错。我的 nagwin 盒子成功地保持了与类似服务器的连接,一整晚都没有出现任何问题。而且我的主要 Nagios 配置没有任何问题。我能够成功地在 nagios 和 nagwin 监控之间切换另一台服务器,只需加载和卸载 NRPE.dll 即可,没有任何问题。我尝试卸载 NSclient++ 并使用新配置重新安装,但仍然收到错误。截至目前,服务器上的防火墙已关闭,NSclient++ 设置为接受来自任何服务器的连接,没有密码,我还关闭了 SSL,并加载了 NRPE 模块。任何想法都将不胜感激,我不是高级 Nagios 用户,但我确实知道如何解决这个问题,并且可以轻松地将其分解并重新设置。

我还想补充一点,在测试模式下,NSclient++ 也无法处理 check_NRPE 命令。

答案1

这个答案可能看起来有点愚蠢,但我也遇到过类似的问题,结果发现是 nsclient++ 版本的一个错误。我建议升级到最新的稳定版本,看看问题是否仍然存在。

如果新的配置文件不起作用,这听起来像是 nsclient++ 的问题。在这种情况下,可能值得发布一个错误让他们仔细查看:http://www.nsclient.org/nscp/newticket 或者他们的数据库中可能已经存在类似的错误。

也可能是 .dll 问题,值得检查机器上的事件查看器以查找其他错误。

希望这对你有帮助。

答案2

首先,测试模式下没有“check_nrpe”命令。NSClient++ 是一个 NRPE 代理,具有许多内置的内部命令。

诊断这种情况的正常方法是:

  1. 停止服务。
  2. 以“测试”模式启动 nsclient++。(即 nsclient++ /test)
  3. 等待...
  4. 检查来自 Nagios(或您喜欢的)的调用时的日志内容。
  5. 修复问题(通常此类问题与 SSL 配置问题、允许的主机配置问题等有关)。
  6. (重新)启动 nsclient++ 服务

另一个选择是检查日志文件和/或启用调试日志记录。如果没有“这些信息”,诊断将非常困难。

// 迈克尔·梅丁

相关内容