我有一台旧服务器(基于 P4),nagios(以及所有其他要监控的工具)正在其上运行。
在过去几周中,我们发现了一种奇怪的行为。
在 /var/spool/pnp4nagios(临时文件在被 pnp4nagios 守护进程处理之前存储在其中)中,我们有许多文件,例如 perfdata.1274949941-PID-18839,并且我们在 npcd.log 中收到错误:
[05-27-2010 11:17:46] NPCD: ThreadCounter 0/15 File is perfdata.1274951306-PID-27849
[05-27-2010 11:17:46] NPCD: File 'perfdata.1274951306-PID-27849' is an already in process PNP file. Leaving it untouched.
有时有些图表没有绘制出来。服务器负载很大(通常大约 5-6),我怀疑 npcd 超时并遗留了这些文件。我能做什么(除了更换服务器)?
有关系统的一些信息:
centos 5.5
nagios 3.2.1
pnp4nagios 0.6(来自来源)
谢谢
答案1
我不确定这是否是您要找的,但您可以看看增加 process_perfdata.cfg 中的超时时间。在nagios-门户网站
答案2
当我从经典的 pnp4nagios 配置(批量)转移到更高效的 npcd 模式和 nagios 模块(npcdmod)时,此错误消失了。
我能够使用 Nagios 和 pnp4nagios 中的 google perftools 稍微加快服务器速度。至少现在我们没有丢失任何 perfdata。
可能最好的方法仍然是更改服务器。