在后端服务上切换节点池后,GCP 负载均衡器停机

在后端服务上切换节点池后,GCP 负载均衡器停机

我们有一个蓝绿部署系统,我们已经使用了很长时间。负载均衡器上有两个后端服务。一个服务用于测试,另一个用于生产。这些后端服务背后使用了 2 个不同的节点池 (k8s)。要将新版本部署到生产中,我们只需在生产后端服务上更改实例组。它确实工作了很长一段时间,直到 2019 年 6 月。在短时间内(大约 2-3 分钟)切换实例组后,后端服务不可用,LB 响应 502 错误。

我还在 GCP 错误跟踪器中创建了一个问题,其中包括屏幕截图和重现步骤 -https://issuetracker.google.com/issues/136020917

答案1

这是预期的行为。后端服务的更改不是即时的。您的更改可能需要几分钟才能在整个网络中传播。

最佳做法是,在进行任何更改之前,先创建一个实例组。然后等待它变得健康并验证流量。之后可以删除其他实例组。

答案2

这是一种预期的行为,根据 GCP 中的文档,对负载均衡器中的后端服务所做的任何更改都会导致后端几分钟内无法通过负载均衡器访问。

话虽如此,我建议按照此文档在 GKE 中执行滚动更新。使用此更新将消除停机时间。

[1]执行滚动更新 https://cloud.google.com/kubernetes-engine/docs/how-to/updating-apps

相关内容