同一主机的多台监控机器

同一主机的多台监控机器

我对监控还不太熟悉,目前正在尝试为我们的网络基础设施设置监控解决方案。我们的硬件相当老旧,因此随时可能出现故障。我们已经针对这种情况采取了预防措施(尽可能避免单点故障),但我们希望至少在出现故障时得到通知。单台机器监控我们的基础设施并不合适,因为这台机器可能会在我们不知情的情况下发生故障。我想到了一些解决方案,但没有一个真正让我满意。

我有以下要求:

  • 单个监控机器可能随时发生故障,但不会造成问题
  • 配置可以集中完成(例如添加要监控的新主机)
  • 总体而言配置和维护都很方便(我不知道几年后谁将管理网络)。

我目前的想法:

  • 在两台机器上设置 OMD,一台作为主服务器,另一台作为副本服务器。我在这里遇到的问题是,我似乎无法告诉两台机器监控所有主机。我只能为每个主机选择两个监控实例中的一个。
  • 设置一个“主”OMD 来监控一切,并设置一个“从”OMD 来只监控主OMD。我不太喜欢这个解决方案,因为如果主OMD 与其他主机同时死机,我只会知道监控器发生故障。
  • 配置一个OMD实例并将此配置导出到另一个实例=>可维护性不太好。

我们没有太多机器需要监控,在可预见的未来,任何时候监控的机器可能都不超过 20 台。如果您对如何实现这一点有任何想法,我很乐意听听。

答案1

如果您正在使用配置管理系统(您应该这样做),您将能够在几分钟内重新部署您的监控主机。因此,您所需要的只是第二个监控实例,其唯一任务是监控“主服务器”。

相关内容