我大量使用 nagios 来监控许多服务器和服务,并且每天都依赖它。截至目前,所有服务都会写入系统日志(当前为 CentOS 6.9),并且系统管理员会在服务发生故障时收到通知。但是,已确认的服务仍会写入系统日志,因此我会不断收到已确认服务的通知。有没有办法将 ACKNOWLEDGED 添加到日志条目中,以便我可以通过 logcheck 过滤掉它们?以下是当前日志条目的示例:
8 月 16 日 00:00:00 nagios[4711]: 当前服务状态:;Apache 服务器;严重;困难;4;严重 - 套接字超时
我想要实现的目标是:
8 月 16 日 00:00:00 nagios[4711]: 当前服务状态: 已确认; Apache 服务器; 严重; 困难; 4; 严重 - 套接字超时
或类似的东西。
我还会将此发布到 Nagios 论坛,因此请忽略任何交叉帖子。
答案1
您管理警报的方式很奇怪。我的意思是,Nagios 有自己的通知机制,效果很好,您不需要检查日志。但如果您想继续使用您的方法,我可以看到 3 个解决方案:
- 修补源代码。这真的不是我要走的路。此外,如果你更改日志格式,你最终会破坏报告页面,因为它们使用日志作为信息来源
- 使用通知脚本创建一个虚假联系人,该脚本会解析事件并将您想要/需要的所有信息写入日志文件
- 与上面相同,但使用事件处理程序(我会选择这个)
Nagios 文档中的一些信息: