我们正在评估 GKE,我想知道推荐的集群划分策略。我们目前有大约 20 个站点用于不同的生产客户。每个项目都应该有自己独立的集群吗?一个用于生产,一个用于阶段?我们是否应该为所有项目设置两个巨型集群,一个用于生产,一个用于阶段?
人们很容易认为,如果有一个大型集群,所有生产站点都处于运行状态,那么它们就可以最有效地共享资源,但同样,这也意味着集群出现问题会导致所有站点同时瘫痪。我真的不知道这种情况有多普遍。
这可能是一个次要问题,但当我们升级集群时,我们正在试验(有 2 个节点),在其上运行的站点经历了 4 分钟的停机时间。GKE UI 确实说如果节点不是太多,它可能会遇到停机,但没有具体说明有多少个节点——我想这也应该是如何划分集群的一个考虑因素。
谢谢你的帮助。