我需要一个监控系统,很像为云构建的 ganglia / nagios。
我需要它来支持:
- 动态添加/删除节点。(节点关闭,并不意味着节点故障......)
- 基于动态节点的分类,意味着节点可以将它们自己标识为 X 组的一部分(神经节几乎正确地做到了这一点,但缺少动态部分......)
- 不需要多播支持(通常不允许在基于云的设置中)
- Hadoop、Cassandra、Mongo 等最新酷炫东西的插件会很酷。
更多功能包括:外部 API、Web 界面等。
我研究过 Ganglia 和 munin,它们似乎都差不多(但并不完全一样)。我也会选择价格合理的软件即服务解决方案。
我目前正在做研究,因此非常感谢您的建议。
谢谢你,
马克西姆
答案1
答案2
实际上,您谈论的是某种配置管理系统来管理您的监控。本质上,您需要在配置新主机时配置监控,并在关闭主机时取消配置监控。在内部,我们使用 puppet 将主机配置到 nagios 中,然后手动删除,因为这不是一项常见任务。随着时间的推移,取消配置过程也将实现自动化。
我认为 chef 和 puppet 是该领域的佼佼者。