为什么我的自动扩展组实例不健康?

为什么我的自动扩展组实例不健康?

我注意到 AWS 自动扩展组存在一个非常奇怪的问题。

实例被(错误地)报告为不健康。然后实例被不必要地终止和替换。这会导致问题,因为它使 ASG 没有足够的容量来应对负载。

为了尝试找出问题所在,我暂时停止了 ASG 的“终止”进程。

目前,我的组中有一个实例被 ASG 报告为不健康。登录实例并直接测试健康检查证明它实际上是健康的。

此外,与 ASG 关联的负载均衡器也报告所有实例均运行正常。

我的问题是。如果组的运行状况检查类型设置为“ELB”,并且负载均衡器报告实例为健康,那么我的 ASG 怎么会认为实例为“不健康”?

有什么方法可以让我查明 ASG 将实例标记为“不健康”的时间和原因?

此 ASG 目前与 2 个经典 ELB 和 2 个 ALB 目标组相关联。我们正在从 ELB 迁移到 ALB。

如上所述,两个 ELB 和两个目标组都报告所有实例均健康。

答案1

我猜问题出在实例属于多个 ELB/ALB TG 时。我怀疑如果其中一个 ELB/ALB 因任何原因认为实例不健康,则可能会触发实例终止。

更改健康检查键入EC2直到完成迁移。

最佳实践是让 ASG 只与单一负载均衡器

希望有帮助:)

相关内容