Ubuntu 18.04 的 CUDA 10.1 deb 安装无法初始化 NVML

Ubuntu 18.04 的 CUDA 10.1 deb 安装无法初始化 NVML

带有 的 Ubuntu 18.04 4.18.0-15-generic

我一直在关注https://www.pugetsystems.com/labs/hpc/How-To-Install-CUDA-10-together-with-9-2-on-Ubuntu-18-04-with-support-for-NVIDIA-20XX-Turing-GPUs-1236/

在遇到一系列问题并使用 之后lightdm,我终于能够nvidia-smi使用运行文件获得一个带有 CUDA 的运行系统并...。我执行了sudo nvidia-uninstall并从 .deb 重新安装了 CUDA 以获取prime-select。但随后nvidia-smi失败了Failed to initialize NVML: Driver/library version mismatch

$ dpkg -l | grep nvidia
ii  libnvidia-cfg1-418:amd64                        418.67-0ubuntu1                              amd64        NVIDIA binary OpenGL/GLX configuration library
ii  libnvidia-common-418                            418.67-0ubuntu1                              all          Shared files used by the NVIDIA libraries
ii  libnvidia-compute-418:amd64                     418.67-0ubuntu1                              amd64        NVIDIA libcompute package
ii  libnvidia-decode-418:amd64                      418.67-0ubuntu1                              amd64        NVIDIA Video Decoding runtime libraries
ii  libnvidia-encode-418:amd64                      418.67-0ubuntu1                              amd64        NVENC Video Encoding runtime library
ii  libnvidia-fbc1-418:amd64                        418.67-0ubuntu1                              amd64        NVIDIA OpenGL-based Framebuffer Capture runtime library
ii  libnvidia-gl-418:amd64                          418.67-0ubuntu1                              amd64        NVIDIA OpenGL/GLX/EGL/GLES GLVND libraries and Vulkan ICD
ii  libnvidia-ifr1-418:amd64                        418.67-0ubuntu1                              amd64        NVIDIA OpenGL-based Inband Frame Readback runtime library
ii  nvidia-compute-utils-418                        418.67-0ubuntu1                              amd64        NVIDIA compute utilities
ii  nvidia-dkms-418                                 418.67-0ubuntu1                              amd64        NVIDIA DKMS package
ii  nvidia-driver-418                               418.67-0ubuntu1                              amd64        NVIDIA driver metapackage
ii  nvidia-kernel-common-418                        418.67-0ubuntu1                              amd64        Shared files used with the kernel module
ii  nvidia-kernel-source-418                        418.67-0ubuntu1                              amd64        NVIDIA kernel source package
ii  nvidia-modprobe                                 418.67-0ubuntu1                              amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-prime                                    0.8.8.2                                      all          Tools to enable NVIDIA's Prime
ii  nvidia-settings                                 418.67-0ubuntu1                              amd64        Tool for configuring the NVIDIA graphics driver
ii  nvidia-utils-418                                418.67-0ubuntu1                              amd64        NVIDIA driver support binaries
ii  xserver-xorg-video-nvidia-418                   418.67-0ubuntu1                              amd64        NVIDIA binary Xorg driver

答案1

我不确定这是从哪里开始起作用的但是!

  1. sudo prime-select nvidia并切换到 nvidia 显卡

如果这不起作用并且您之前已经使用运行文件安装过 CUDA,那么我实际上所做的是:

  1. 卸载 CUDA 和所有驱动程序,我认为apt-get purge nvidia-*是类似的cuda-。可能有一个随机的libcuda或类似的东西,我忘了名字,抱歉。还可以转到/usr/local/cuda并尝试找到卸载程序,因为应该有剩余的文件,然后运行该脚本。

  2. 再次从运行文件安装 CUDA。

  3. 使用nvidia-uninstall或任何应使用的卸载命令进行卸载。应为PATH。按照说明操作并删除所有内容。

  4. 从 .deb 安装 CUDA。然后不要更新cuda或者nvidia其他什么。

  5. 安装prime-select,执行步骤0,就应该没问题。

相关内容