监控 EC2 实例的好方法

监控 EC2 实例的好方法

我想听听您监控在 EC2 中运行的 Linux 实例的方法。我非常习惯使用 Nagios 来监控基于 Web 的应用程序生态系统的各个方面,但它的模型似乎不太适合那些经常被破坏和重建的机器。我的 EC2 实例由 RightScale 中介,它有自己的监控方案,但我发现它用处不大——尽管我确实打算进一步研究它们的监控。

所讨论的实例运行正常的开源软件:MySQL、Apache、Passenger、Rails。

提前谢谢了。

答案1

可以使用脚本中的 ec2 工具来动态生成 nagios 配置。如果所有 EC2 实例都需要相同的服务,则您可以将服务与主机组而不是主机关联,并使用通过 cron 运行的脚本动态生成主机/主机组定义。然后,您可以执行 kill -HUP(或 /etc/init.d/nagios reload 或 svcadm nagios refresh)并让 nagios 重新加载新配置。这是一个轻量级操作(不需要重新启动),因此可以经常执行。该脚本必须读取活动实例及其地址的列表,并为每个实例生成主机定义。

答案2

您想监控每个EC2 实例或全面的正常运行时间和性能?

我们并不真正关心每个实例的作用,而是监控我们的整体 Web 应用程序响应时间和功能。有几种工具可以实现这一点。我们喜欢警报狐它每 15 分钟为我们运行一次相当复杂的基于 iMacros 的交易监控脚本。

答案3

也许值得一看的是 cloudkick。具体要看你需要做哪种监控,但它是专门为 EC2 设计的:

https://www.cloudkick.com/

答案4

我使用 Ganglia 来监控我的集群:

http://ganglia.info/

只需确保将其配置为使用单播并在一段时间后删除死主机。

相关内容