GPU 的 ESXi PCIe 直通在客户机操作系统中被识别但不起作用

GPU 的 ESXi PCIe 直通在客户机操作系统中被识别但不起作用

我有一台 ESXi 服务器,在将 Radeon RX 5700 传递到 Windows 10 VM 时遇到问题。Windows 可以看到 GPU,但报告说它已停止该设备,因为它报告了问题(代码 43)。

我删除了为此创建的第一个 VM,并创建了一个新的,但它产生了同样的错误。我还创建了一个 Debian VM,它也能识别 GPU,但无法使用它。

该服务器基于 Supermicro X9SRL-F、Xeon E5-2650v2 和 128GB DDR3 ECC 内存。

VM 有 8 GB 的 RAM(全部保留)和 2 个核心(1 个插槽)。IOMMU 未暴露给 VM。我尝试过在 VM 的配置中使用和不使用“hypervisor.cpuid.v0”参数(设置为 false)。

我尝试过将 GPU 的供应商/设备 ID 和关联的 HDMI 音频通道添加到 /etc/vmware/passthru.map,并将 resetMethod 设置为默认值,将 fptShareable 设置为 false。

BIOS 中启用了“4G 以上解码”。

有一个 LSI00301 传递到同一台服务器上的另一台 VM(FreeNAS),并且多年来一直运行良好。

Radeon RX 5700 在连接到物理计算机时可以工作。

GPU 通过 1x 至 16x PCIe Riser(v.009S)连接到服务器,已确认可与另一台计算机一起使用。

我已经尝试了服务器上不同的 PCIe 端口。

Windows 10 VM 已完全更新(内部版本 19041.508),并安装了 Radeon Software Adrenalin 2020 Edition(v20.9.1)和 VMware Tools(v10.3.10.12406962)。

有一个显示器通过 HDMI 连接到 GPU。

将 GPU 连接到服务器的目的是为了加密挖掘。

答案1

您需要稍微调整一下您的 VMX 文件:

  • 关闭客户机

  • 编辑 VMX

    hypervisor.cpuid.v0 =“FALSE”

    pciHole.start = "2048"

您可以通过 SSH 连接并使用 VI 进行编辑,或者从数据存储中下载它,使用您想要的任何(基本)编辑器对其进行更新,删除原始版本并上传更新后的版本。

不要使用 GUI 编辑器来编辑它;您可能会破坏它。

  • VMX 更新后,启动客户机

您还可以从 ESX CLI 更新虚拟 GPU 管理器:

  • 进入维护模式
  • 用于software vib install -v安装最新的 VGPUM
  • 重启
  • 退出维护模式

相关内容