每天部署数十万个短期作业

Question 1

如果作业的生命周期很短，那么实施作业队列和一组生命周期较长的工作者（这些工作者会从队列中使用作业）可能更能达到您的目的。您是否需要在 k8s 本身中运行作业？

Answer

如果作业的生命周期很短，那么实施作业队列和一组生命周期较长的工作者（这些工作者会从队列中使用作业）可能更能达到您的目的。您是否需要在 k8s 本身中运行作业？

Question 2

假设您的集群资源有限。如果要实现更高的作业量，则必须使用更高效的应用程序或更多资源。

像您使用的大型提供商会根据您的预算向您出租尽可能多的实例。扩展您的集群，可能自动扩展。如果您在短时间内安排工作，可能需要一些备用容量。

轮询 Kubernetes 作业的另一种方法是通过代码传递消息。在作业结束时，对调度程序进行某种回调以指示已完成。

当然，它可能已经死亡并且永远不会报告。最终这需要成为一种失败状态。考虑在典型的最短作业时间之后每隔一段时间轮询该作业，并在达到硬性限制后放弃它，例如 activeDeadlineSeconds。

Answer

假设您的集群资源有限。如果要实现更高的作业量，则必须使用更高效的应用程序或更多资源。

像您使用的大型提供商会根据您的预算向您出租尽可能多的实例。扩展您的集群，可能自动扩展。如果您在短时间内安排工作，可能需要一些备用容量。

轮询 Kubernetes 作业的另一种方法是通过代码传递消息。在作业结束时，对调度程序进行某种回调以指示已完成。

当然，它可能已经死亡并且永远不会报告。最终这需要成为一种失败状态。考虑在典型的最短作业时间之后每隔一段时间轮询该作业，并在达到硬性限制后放弃它，例如 activeDeadlineSeconds。

相关内容