监控多个网络的小子集

监控多个网络的小子集

什么软件适合监控多个小型且分散的网络?

我公司销售的产品需要在客户的网络上部署多台 Linux 服务器(通常是三台服务器,但也可能更多)。目前,我们在 25 多个网络中部署了此类服务器,而且这个数字还在不断增长。我们希望监控这些机器的总体运行状况以及每个网络上各种自定义处理位的状态。我们通过多种方式(直接 SSH、VPN、WebEx 等)连接到它们,因此能够从命令行和 Web 界面查看所有内容将非常有用。

这些信息将(以某种方式)在我们的办公室汇总以供概览,但该机制超出了本问题的范围。

我知道“您使用什么工具来监控您的服务器?”但这似乎涵盖了对整个网络以及大型网络的监控。其中一些似乎过于复杂,无法仅监控每个网络中的少数几台机器。

我一直在试验 Nagios,但想知道是否有更适合我们特定用例的工具。

类似问题:

答案1

如果您正在寻找系统级资源(CPU/内存/磁盘使用情况、服务器负载等),那么安装任意数量的带有本地代理的监控工具应该能够提供这些数据。它们通常(包括我的公司 Panopta 提供的工具)在本地收集数据,并将结果推送到中央监控位置,在那里存储数据以进行报告和警报。确保您使用的工具可以扩展以处理听起来相当可观的服务器数量,并让您轻松地按客户细分它们,以便您清楚地了解每个客户的配置和性能。

检查您描述的环境中网络服务的可用性更加困难,除非您可以建立一个中心位置,在该位置终止每个 VPN 或 SSH 隧道,以便访问每个环境中运行的服务。如果您确实有这样的端点,您可以本地运行监控软件(例如 Nagios、Zabbix 或 Zenoss),并让其通过您设置的隧道检查服务。或者,您可以使用类似我们的监控设备的东西,它可以安装在该位置来执行检查,然后将这些结果与本地代理收集的服务器级指标合并。

答案2

你可能想看看新剑

这仍然是一个年轻的项目,但似乎适合这种“延伸”的网络。

相关内容