我已经使用 nrpe 启动并运行了 nagios,但是我对于自己配置它还比较陌生。
有没有什么方法可以获得支票的原始数字,而不仅仅是 ok/not ok?
例如,如果我想监控一个运行了几个小时的进程中主机的内存使用情况并观察它是如何波动的,nagios 可以做到这一点吗,还是它只会在达到某个阈值时告诉我?
答案1
我相信你正在寻找一个 RRDtool 来为你收集数据。我使用检查它是 Nagios 的扩展集合,但还有大量其他选项。
答案2
通常,nagios 会通知您正常/不正常。我认为可以肯定地说,大多数人使用 nagios 来让他们知道他们的环境中是否发生了一些奇怪的事情。它确实显示了当前状态的数字,但这听起来不像是你想要的。
我以前曾从 nagios.log 中提取过值。虽然不太好,但还是可行的,如果这是一次性操作,这可能是你最好的选择。(例如:有人曾要求我提取 Exchange 在一段时间内消耗所有存储空间的历史记录。)
如果您希望 nagios 始终检查波动,您可能可以为 npre 编写某种自定义脚本,将 ok/not Okay 定义为“波动太大”。
我希望这能有所帮助。
答案3
nagios 有各种 RRD(一种用于收集此类时间数据的特殊类型的数据库)附加组件。
但是,nagios 并不是这种性能监控的良好选择。它实际上最适合用作警报系统,大多数网站使用 ganglia 或 cactus 等其他系统进行持续性能跟踪。
Nagios 是烟雾报警器,ganglia 是温度计。
每个检查都有第三个字段,您可以在其中放置任何类型的数据,但这需要搜索 nagios.log 文件。
答案4
Nagios 基本上是一个警报系统正如其他人所说,即没有嵌入历史报告系统。
然而,有许多插件可以帮你完成这个工作。我相信NagiosGraph是最常见的,安装和使用都足够简单。
您可以查看您的指标的每日、每周、每月和每年视图,还可以通过操作指标映射(nagiosgraph 映射文件)为您的插件创建自己的图表。