我正在尝试在 X10SRH-CF 上设置 5 个 GPU 来运行 Tensorflow,但似乎无法在插入超过 3 张卡的情况下启动主板。在某些布局中,我使用 4 张卡启动它,但操作系统(Ubuntu 服务器 16.04)只看到插入了 3 张卡。如果我在所有插槽之间移动一张卡,它就可以正常工作,因此单个插槽似乎不是问题。
据我所知可能可能是 CPU/PCH PCIe 使用问题,但我对这些类型的主板不是很有经验。
唯一插入的外围设备是 GPU 和 2 个不在 RAID 中的 SSD。
答案1
Supermicro X10SRH-CF 支持以下 PCIE 配置:
- 1 个 PCI-E 3.0 x4(x8 插槽)
- 1 个 PCI-E 3.0 x8(x16)插槽
- 2 个 PCI-E 3.0 x8 插槽
- 1 个 PCI-E 2.0 x2(x4 插槽)
- 1 个 PCI-E 2.0 x4(x8)插槽
因此,首先要检查的是您的卡需要多少个 PCIE 通道?它们是同一型号的 GPU 卡吗?如您所见,插槽的大小并不直接对应于该插槽可用的通道数。例如,16 号插槽中只有 8 个可用通道,因此如果您放入需要 16 个通道的卡,它将只能以半速运行,这对于特定类型的 GPU 卡来说可能是也可能不是问题。因此,您必须确保有足够的 PCIE 通道可用来支持所有卡
编辑:还要确保你有足够的电源来为你的主板、CPU、其他外围设备和 5 张 GTX 1080 卡供电。看起来每张卡都声称需要 180W。安全的做法是提供至少 1.5 倍的功率。这将需要
1.5x180W x 5 = 1350W
这还只是针对 5 个 GPU 卡而言的。请确保您的主板、CPU、HDD 和其他外围设备有额外的电源。另外请记住,在系统启动之前,启动时所需的功率会有点高。因此,请确保您还为每个需要电源的组件增加了一点容差。