AWS 中断情况下的正常运行时间问题

AWS 中断情况下的正常运行时间问题

我正在美国东部的不同可用区中通过 2 个实例运行 Elastic Load Balancer 备份。我也在使用多可用区 RDS。理想情况下,这应该可以确保如果一个可用区发生故障,它不会影响应用程序,因为所有内容都分布在多个可用区中。

但最近的 AWS 中断导致该应用程序长时间无法运行。我不知道这是怎么发生的。如果有人能指出问题所在就太好了。

我的主要问题是,将来如何避免这种情况?我可以跨不同区域甚至提供商设置应用服务器,并使用 DNS 进行负载平衡,但我该如何处理 MySQL?读取副本会引入一些滞后,我希望避免这种情况。

答案1

您需要在不同区域拥有 AWS 实例来应对最近两次大规模 AWS 中断。

由于弹性负载平衡是按可用区进行的,因此您还需要将 route53 添加到组合中,以便将故障转移到其他区域

答案2

你必须在多个可用区中设置应用程序的两个工作副本,因此你将使用复制(主-主),因此当一个可用区出现故障时,您可以将流量切换到另一个可用区。这对财务和人力资源来说都是困难的。

相关内容