我有一组 CPU 密集型工作机器,我想扩展它们,但我也很便宜。假设无论实例成本如何,工作都必须始终及时完成,那么是否有道理:
- 目标 CPU 为 80% 的抢占式实例组
- 目标 CPU 为 90% 的常规实例实例组
在这种情况下,我期望:
- 在可能的情况下,可抢占实例组将扩大规模以满足需求,而标准组则缩小至其配置的最小值。
- 当抢占式实例无法满足需求时,标准实例组就会增大。
GCE 实例组扩展是否能如我预期的那样工作?我是否应该考虑其他调度程序?
作为参考,这将是 GCP 中工作器基础设施的第二次迭代。目前,我们在非自动扩展组中使用 32 个 n1-standard-8 实例,但我们希望将核心数量减少一半。
答案1
我找不到有关负载均衡器内部结构的公开文档,但是本白皮书可能会引起你的兴趣。
我相信您使用两个实例组的方法可能适合您的情况。由于无法预测哪个组将首先自动扩展,因此使用目标 CPU 实际上应该可以让您权衡哪个组首先自动扩展。
我还看到一个警告,即定义非抢占组中的最大节点数。我的意思是,如果该组达到最大节点数,并且可抢占组无法扩大规模您的应用程序可能会受到影响。无论如何,如果您使用这种类型的虚拟机,您的应用程序应该具有容错能力。