这有点Folding@Home 的交叉发布。我想验证我是否已正确配置了 Ubuntu 的所有配置。我的 GPU 如下:
- GeForce 980 ti
- GeForce 1070
- 维加 56
Ubuntu 是 18.04 x64,最新更新,无头,没有 GUI/桌面包。我的两个 NVIDIA 卡都运行良好,Folding@Home 可以使用它们。我使用以下软件包配置它们:
- nvidia-驱动程序-390
- ocl-icd-opencl-dev
OpenCL 软件包是多供应商的,所以我认为它适用于我的 Vega。我按照这个操作(Frontier 说的,但我抓取了Ubuntu x86 64 位部分),基本上直接从 AMD 安装:https://gpuopen.com/vega-frontier-installing-the-driver。没有成功。然后我尝试安装mesa-opencl-icd,但这导致我所有的 GPU 停止折叠,所以我卸载了它。
clinfo
没有列出我的 Vega。
lspci
节目05:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 XT [Radeon RX Vega 64] (rev c3)
05:00.0一定会/sys/总线/pci/驱动程序/amdgpu。
折叠相关日志,是这两条:
ERROR:No compute devices matched GPU #2 AMD:5 [Radeon Rx vega]. You may need to update your graphics drivers.
ERROR:WU03:FS03:Failed to start core: OpenCL device matching slot 3 not found, try setting 'opencl-index' manually.
(将其设置opencl-index
为 0 或 1 都将导致工作单元故障,因此结果相同。客户端无法找到所有 OpenCL 设备本身是一个问题。)
更新:
我看了看AMD 指令。我意识到有一种无头模式,并且静默安装不会安装 OpenCL(特别提到无头计算设置)。
- 跑
amdgpu-pro-uninstall
了apt-get autoremove
- 重新启动
- 冉
./amdgpu-pro-install -y --opencl=pal,legacy --headless
- 重新启动
导致所有插槽再次失败。