多租户（多用户）GPU 容器基础设施解决方案

2024-5-31 • tag-icon

我们需要的：来自不同公司的几个团队希望共享我们的 GPU 来完成深度学习任务（三台计算机，每台计算机有多个 GPU）。因此，需要为多个用户管理多个 GPU。

问题： 实现这一目标的最佳开源工具有哪些？

例如 Rancher 2.0？Mesosphere？我们应该如何设置存储？NFS？Uber 和 Google 又是如何做的？其他 DL 初创公司又是如何做的？

类似未解答的问题：

相关内容