我有一台 HP Proliant DL580 G7 服务器,其 P65 BIOS 更新自 2015 年起(我认为这是最新的 BIOS)。
我在其中安装了 PCIe 扩展板并安装了 4 个 Tesla K80 GPU。使用 10 针转 8 针电缆将它们连接到 PSU 板。当我打开服务器时,我看到 GPU 上的绿灯亮起。在 BIOS 中,我将 PCIe 设置为使用 Gen 2.0 设置。
安装了 Windows Server 2012 R2(带更新),并从网上安装了所有驱动程序。设备管理器中没有任何缺少驱动程序的设备。但是,Tesla K80 GPU 没有出现在设备管理器中。
当我尝试安装官方 NVidia 驱动程序时,出现错误“未找到兼容硬件”。
我还移除了新安装的 PCIe 扩展板,以防它(不知何故)与主板不兼容,但这也无济于事。
我究竟做错了什么?
更新 1:我安装了具有企业许可证的 VMWare ESXi,以查看 Nvidia 设备是否出现在那里,以便我可以使用直通并在 VM 中使用 GPU,但 Nvidia 设备未出现在该列表中。
我安装了 Ubuntu 20.04,因为与其他 Linux 发行版相比,它的硬件检测能力最强,但无法加载 GUI。Ubuntu 并未被列为 DL580 G7 的官方支持操作系统之一,因此我选择了下一个选项。
我安装了 RHEL 6.10,因为它是受支持的操作系统之一,当我执行“lspci”时,我没有看到任何 Nvidia 设备。
答案1
不幸的是,DL580 G7 上的 bios 不支持 MMIO。我得到的最新 rom 是 P65 05/21/2018,但我仍然找不到其中的 MMIO 支持。没有 MMIO,系统无法映射超过 4GB 的 vRAM,因此,驱动程序无法识别该设备。