在 Windows 上安装 4-5 个 CUDA 显卡需要什么样的硬件?

在 Windows 上安装 4-5 个 CUDA 显卡需要什么样的硬件?

我需要运行一些繁重的 CUDA 测试,我可以购买 4-5 张 quadro 或 tesla 显卡。我的问题是:我应该购买什么样的硬件才能在 Windows 环境中使用 Nsight?我认为我不需要普通的台式电脑,因为它们只有 2-3 个 PCI-Express 插槽。我需要什么来设置这样的系统?如果可能的话,我不想使用 Linux,因为我对 VS 和 Nsight 很熟悉

答案1

如果两三个 PCI-e 插槽不够,您可以购买带有更多插槽的主板。您肯定不想购买预装台式机。这不仅是因为预装台式机通常缺乏适当的可扩展性,还因为 4 或 5 个 CUDA 卡会消耗大量电量。您需要一个带有大电源和适当冷却的定制台式机。

其次,您需要寻找具有 PCI-e 版本 3 的主板。不是为了带宽(它是 PCI-e 版本 2 的两倍),而是为了更低的延迟。

在谷歌上快速搜索“主板 5 pci express 插槽”会得到几个结果。其中之一是这个带有7个PCI-E插槽的主板*

请注意,7 个 PCI-e 插槽并不意味着您总是可以使用 7 个 PCI-e 卡。
您可能会遇到物理限制。我的意思是,CUDA 卡通常有 2 个插槽宽,您无法在每个插槽中塞入一张卡。相反,您最终可能会得到如下图所示的结果:

标有 2 个宽插槽的主板图片

假设没有其他卡(例如没有 RAID、没有显卡等)并且机箱足够宽,您可能能够在示例主板中塞入四张卡。如果您想要更多卡,您可能必须使用 PCI-e 扩展器,即使这样也会很棘手。

最好与一些高性能通用计算架构而不是尝试使用大量性能较低的卡。检查Nvidia 的 CUDA 卡列表确实让选择卡变得容易。目前是 Tesla K20(两个 K20 的性能将优于三个 Tesla C2075、2050 或 C2070)。而且它们确实有两个插槽宽。

这可能意味着您最多可以用来三个K20,只有一个插槽。

请注意,每张卡的功率为 235 瓦。三张卡的功率为 705 瓦。这还不包括主板(大约 50 瓦)、CPU(100 瓦左右)、RAM(每个 DIMM 的功率不大,但您可能有几个)、风扇(每个 3-5 瓦,假设您的塔式机箱中有六个)、硬盘、可选显卡(不是真正需要的,您可以在没有显示器的情况下运行,只需 RDP 即可),......简而言之:您需要一个大 PSU 和大量冷却。

所有这些都忽略了一些细节,例如哪些插槽是 PCI-e v3。它们都是 V3 吗,还是只有一两个插槽,其余的是 v2?有多少连接器是 x16,有多少连接器在使用两个插槽时会回退到 x8。(我可以查找示例主板,但这只是一个例子。查看所有相关主板的手册以帮助您做出选择)。


顺便说一句,你不是第一个问这个问题的人。有些人,比如法斯特拉已经构建了类似的PC。

在此处输入图片描述



*免责声明:我不为 ASRock 工作。这只是我发现的第一个好链接。

相关内容