目前为止,我发现有关 Azure HPC Scheduler 的调度策略、资源管理策略的信息很少。
我将非常感激有关以下问题的任何信息:
- 头节点使用什么调度策略将作业分散到计算节点?
- Azure Scheduler 是否使用有关作业的先前信息(计算时间、内存需求...)? 如果是,它如何获取这些信息?
- Azure Scheduler 是否将一个作业拆分为一个计算节点上的多个并行作业?
- 它对计算节点故障有任何保护吗?(当计算节点停止响应时它会做什么)
- 它是否支持增加/减少计算节点?
- 可以取消作业吗?PS 我知道 MSDN 资源Windows Azure HPC 调度程序。我只找到了有关如何使用此 Scheduler 的信息,但几乎没有找到有关其内部如何工作的信息。