背景:
我目前正在尝试让 CUDA-8.0 在 ubuntu 14.04 上运行,而之前版本的 CUDA 已经安装。这是一个非常谨慎的平衡行为,需要以正确的顺序采取正确的步骤。不幸的是我失败了。这让我遇到了无法描述的错误,而且没有明显的解决方法。
解决这些问题的标准方法当然是:重新安装操作系统并重试。然而,这也有明显的缺点。
问题:
我需要删除任何与 CUDA 和 nvidia 相关的内容,以便能够重新尝试安装 CUDA-8.0。这包括任何图形驱动程序。但是,图形驱动程序对于我的操作系统 (Ubuntu 14.04) 的运行可能很重要。我应该如何删除 nvidia 驱动程序而不损坏我的计算机?
我犹豫要不要使用的命令是:
sudo apt-get remove --purge nvidia-*
答案1
我花了一些时间在另一台计算机上工作,推迟了切换 GPU 驱动程序。然后我偶然发现了这篇文章:
https://devtalk.nvidia.com/default/topic/1000667/cuda-setup-and-installation/failed-to-initialize-nvml-driver-library-version-mismatch/
清除 cuda 并删除 /usr/local/cuda、/usr/local/cuda-7-5 等中剩余的所有 cuda 文件,然后重新安装 cuda-8.0,结果出现错误:
Failed to initialize NVML: Driver/library version mismatch
在我看来,这似乎要求我卸载当前驱动程序,然后安装正确的驱动程序。但是,正如链接中所述,仅使用“nvidia-smi”命令也会出现此错误。因此,正如链接中所述,我尝试重新启动计算机(我应该更频繁地这样做),结果成功了!
我不知道重新启动是否能早点解决我的问题。但这肯定是解决方案的一部分,而且我不需要手动对驱动程序进行任何操作。