我正在寻找有关 nagios 等监控系统的非标准用途的灵感,它通常用于检查 HTTP 是否响应等。我很好奇人们如何采用简单的 nagios 框架并以意想不到的方式运行它,所以我可以借用它们。
答案1
我曾经存储过我的 Facebook 好友和 Twitter 关注者列表的副本,并在我取消好友/取消关注时发送 Nagios 警报。
答案2
我使用 nagios 来监控一个由 1100 个节点组成的高性能计算 Linux 集群。Nagios 用于检查 sshd 进程、硬盘 SMART 状态、Infiniband 网络状态、共享文件系统和磁盘使用情况。如果任何这些测试失败,该节点将自动从作业调度程序的生产池中移除,以便对其进行维护。到目前为止,这种方法效果很好。在集群上实施 Nagios 之前,我们收到了很多投诉,称程序无法启动或立即崩溃。实施之后,我们几乎没有抱怨。
我还使用 Nagios 来监控一些 Xen dom-U 实例。如果 dom-U VM 崩溃,Nagios 会自动重启 VM。
答案3
不是我的,但是这是我听说过的对 nagios 最有创意的用法。向这位小伙子致敬!
答案4
我将性能数据收集到 rrd 数据中。因此我进行了一些检查,从最近的检查中读取几个数据点并寻找趋势变化——这些脚本很有用。它基本上是一种自动读取图表的方法。