我已成功将最多 8 个 GPU(NVidia 1060)连接到 Ubuntu 17.10 桌面版,但每次我尝试连接第 9 个 GPU 时它都会崩溃(无法重新启动、内核崩溃、报告等)。
我进行了全新安装,然后按照标准程序安装了开源 NVidia 驱动程序(软件和更新 -> 附加驱动程序 -> 驱动程序 384.90)
然后我关机并添加 GPU。最多 8 个 GPU 时它工作正常。每次我尝试添加第 9 个 GPU 时它都会崩溃。我有一块可连接最多 19 个 GPU 的主板(华硕 B250)。
所以问题很简单(是是或否问题):Linux Ubuntu 17.10 桌面版同时连接的 GPU 数量是否有限制?
更新:我已卸载 Ubuntu 17.10 桌面版并在同一硬件上安装了 Ubuntu 16.04 服务器版,所有 12 个 NVIDIA GPU 均运行良好。所有 12 个 GPU 均已识别并 100% 正常工作。但问题仍然存在:是否可以使用 Ubuntu 17.10 桌面版连接 8 个以上的 Nvidia GPU?
答案1
我在 Z170-AR 主板上使用两个 850 瓦电源,以及其中一个 4 路 PCI-E 分流器和一个 m2 转 PCI-E 适配器,以获得 10 个 PCI-E 插槽。每个 850 瓦电源上有 5 个 GPU,每个 GPU 都使用“sudo nvidia-smi -pl 90”设置为 90 瓦,而且在从 8 个 nvidia GPU 升级到 10 个 nvidia GPU 时也遇到了两个问题。
首先是 SATA 电源连接器损坏,在通向 GPU 9 和 10 立管的 SATA 电缆上,通向最后一个 SATA 插座的其中一根电线的绝缘层已熔化,因此我猜测它在工厂没有正确压接(导致矿机在开始运行后给出有关与 PCI 总线失去通信的错误消息,导致所有 GPU 风扇达到 100%,矿机崩溃)。
我遇到的第二个问题是,一旦超过 8,xserver 就不会启动,我通过在启动菜单中选择高级进入恢复模式、从菜单中选择 root shell,然后尝试 xinit(以段错误结束)来解决这个问题,因此我尝试运行“nvidia-xconfig”以写出一个带有一个 gpu 和一个显示器的默认配置。然后我退出并从恢复菜单中点击恢复,xserver 正常启动,然后我打开 xterminal 运行 nvidia-smi 并看到 10 张卡,并启动 claymore 矿工