我们有大约 50 个 AWS 账户,每个账户都连接到本地、数据中心和一些其他 AWS 账户。
有时由于配置错误,连接会丢失,然后开发人员会稍后告诉我们。
我想要构建监控解决方案,在每个帐户的每个子网中运行一些东西,它可以 ping 其他帐户中的 ip,然后在单个 AWS 帐户中发布指标,以便我可以绘制它。
最初我考虑使用 Lamda,一切都很好,直到我发现无法在 Lambda 中使用 PING,这让我的解决方案失效了。
我真的不想创建不必要的资源。有没有更好的方法?
答案1
其他方法可能是使用 lambda 对所有帐户(或集中)进行云监控。
答案2
我认为有两种工具适合这种情况,但您必须在节点上安装它们的代理。
- Monit - 它可以监控网络并根据任何故障触发。
- Zabbix——企业级监控工具
我一直以不同的组合在我们的服务器(本地数据中心和 AWS)上使用 Monit 和 Zabbix。