如何改进我当前的 HA 设计

如何改进我当前的 HA 设计

我正在尝试创建高可用性应用程序。我当前的设计有两个虚拟机,它们都有公共 IP,都在同一子网中运行,并且两个虚拟机都在 docker 中运行相同的 Web 应用程序。docker 中的应用程序的 SSL 证书和流量由 Traefik 管理。第一个虚拟机是主虚拟机,因此其 IP 已更新为 Cloudflare。正在运行的第三个虚拟机有一个脚本,该脚本通过第一个虚拟机的 IP 访问应用程序以检查它是否收到响应。如果脚本未收到来自第一个虚拟机的响应,则它会发送电子邮件通知以通知我问题,然后此脚本使用第二个(故障转移)虚拟机的公共 IP 更新 Cloudflare,以便流量流向第二个虚拟机。

这个设计运行良好,但非常简陋。我知道这可以改进,但我不确定如何改进,所以需要你的建议。我想要做的是在主虚拟机上运行应用程序的运行状况检查,如果应用程序因任何原因没有响应,则将流量路由到故障转移虚拟机。在我研究的过程中,我遇到了保持活跃,我还没有研究过,但我认为这可能会有所帮助。

在此处输入图片描述

答案1

我建议你考虑使用Oracle 负载平衡器综合健康检查, 随着自动缩放。我可能对 Oracle 的说法不太正确,链接也可能不正确,但这就是在 AWS 中实现的方式,而且这些概念往往跨云。

相关内容