我是应用程序系统管理员\DevOps 团队的一员。目前,我们在 openshift 容器平台上的微服务中运行着大约 25 - 40 个虚拟机,作为应用程序的不同部分,还使用了 Jenkins、Nexus3、一些关系数据库和 mongo DB。
我正在研究如何监控服务器和服务器上的不同 Linux 服务。首先,我发现了 monit,它使用 Web GUI 实现了单服务器监控功能,速度非常快,使用起来也很简单。
然而,我无法通过查看那么多不同的 GUI 来了解网络状态。最近我遇到了 Nagios core 和 XI,目前正在网络的不同节点上部署(Nagios core)nrpe_3.2.1 代理,但由于依赖性问题,我倾向于使用 Nagios XI,因为它易于使用,所以它会“正常工作”。我特别希望服务监控和事件处理程序能够在服务崩溃或状态更改的情况下保持所有运行而无需我的注意。如果我能得到对现有产品的验证或更好的产品推荐(以及希望是免费和开源的),我将不胜感激。谢谢,Noam。
答案1
没有理由不使用 M/Monit 作为此环境中的中心。成本低得离谱,而且可以插入您已建立的系统。