AMD/NVIDIA GPU 驱动程序配置

AMD/NVIDIA GPU 驱动程序配置

这有点Folding@Home 的交叉发布。我想验证我是否已正确配置了 Ubuntu 的所有配置。我的 GPU 如下:

  • GeForce 980 ti
  • GeForce 1070
  • 维加 56

Ubuntu 是 18.04 x64,最新更新,无头,没有 GUI/桌面包。我的两个 NVIDIA 卡都运行良好,Folding@Home 可以使用它们。我使用以下软件包配置它们:

  • nvidia-驱动程序-390
  • ocl-icd-opencl-dev

OpenCL 软件包是多供应商的,所以我认为它适用于我的 Vega。我按照这个操作(Frontier 说的,但我抓取了Ubuntu x86 64 位部分),基本上直接从 AMD 安装:https://gpuopen.com/vega-frontier-installing-the-driver。没有成功。然后我尝试安装mesa-opencl-icd,但这导致我所有的 GPU 停止折叠,所以我卸载了它。

clinfo没有列出我的 Vega。

lspci节目05:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 XT [Radeon RX Vega 64] (rev c3)

05:00.0一定会/sys/总线/pci/驱动程序/amdgpu

折叠相关日志,是这两条:

ERROR:No compute devices matched GPU #2 AMD:5 [Radeon Rx vega].  You may need to update your graphics drivers.
ERROR:WU03:FS03:Failed to start core: OpenCL device matching slot 3 not found, try setting 'opencl-index' manually.

(将其设置opencl-index为 0 或 1 都将导致工作单元故障,因此结果相同。客户端无法找到所有 OpenCL 设备本身是一个问题。)

更新:

我看了看AMD 指令。我意识到有一种无头模式,并且静默安装不会安装 OpenCL(特别提到无头计算设置)。

  • amdgpu-pro-uninstallapt-get autoremove
  • 重新启动
  • ./amdgpu-pro-install -y --opencl=pal,legacy --headless
  • 重新启动

导致所有插槽再次失败。

相关内容