在过去的两个月中,这种情况发生过两次 - 在周末,整个 GKE 集群重新启动。
即使集群设置为手动升级(发布渠道设置为“无”),也会发生这种情况。
有没有办法找出 GKE 集群重启的原因?
答案1
正如所述文档:
无频道
无论你的集群是否注册到发布渠道,集群控制平面始终定期升级。
。 。 。
自动升级通常在数周内分阶段进行。基础设施安全是 GKE 的重中之重,因此控制平面会定期升级,并且无法禁用。但是,您可以应用维护时段和排除条款暂停控制平面和节点的升级。
用于gcloud container operations list --filter="TYPE:UPGRADE_MASTER"
查看最近的控制平面升级:
$ gcloud container operations list --filter="TYPE:UPGRADE_MASTER"
NAME TYPE LOCATION TARGET STATUS_MESSAGE STATUS START_TIME END_TIME
operation-1631397153397-fc924191 UPGRADE_MASTER us-west1-b prod DONE 2021-09-11T22:05:53.397098204Z 2021-09-11T22:10:04.559303783Z