Debian 上计算服务器的任务假脱机程序

Debian 上计算服务器的任务假脱机程序

最近,我们大学购买了一台配备多核 Xeon 和 4 个强大 GeForce 显卡的计算服务器,用于“使用 CUDA 进行高性能计算”学科的课程。

它上面有 Debian Squeeze。我正在尝试找到一种组织任务队列(或任务假脱机程序)的解决方案,以便学生可以启动他们的程序。由于只有一个 CPU,我猜我们必须使用队列:将学生的任务推入队列并逐一启动。

当然,当挂起时应该有能力终止任务。

经过谷歌搜索后,我发现了两件相关的事情:芹菜任务后台处理程序

你能提出一些建议吗?

答案1

你应该考虑秃鹰Sun Grid Engine 的一个分支。Condor 和 SGE 都在学术 HPC 社区中被广泛用于批量调度,并且如果您购买了额外的硬件,它们将允许您优雅地扩展。

答案2

如何使用 Celery 和 PyCUDA 设置任务队列?您将能够在 CPU 之间以及 CUDA 核心之间委派作业。

相关内容