我可以将 Nvidia 驱动程序和 CUDA 安装分离吗?

我可以将 Nvidia 驱动程序和 CUDA 安装分离吗?

与其他人一样,我对如何安装特定 CUDA 版本以进行深度学习的说明感到非常困惑。

当今的主要深度学习库(Tensorflow 和 PyTorch)不支持最新的 CUDA 版本 11.2。但是,当我在全新安装 Ubuntu 后安装推荐的 NVIDIA 驱动程序时,我最终默认获得了 CUDA 11.2,正如我在运行nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39       Driver Version: 460.39       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 3090    Off  | 00000000:09:00.0  On |                  N/A |
| 30%   37C    P8    40W / 350W |    443MiB / 24259MiB |     12%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A       954      G   /usr/lib/xorg/Xorg                 59MiB |
|    0   N/A  N/A      1470      G   /usr/lib/xorg/Xorg                161MiB |
|    0   N/A  N/A      1603      G   /usr/bin/gnome-shell              125MiB |
|    0   N/A  N/A      2031      G   ...AAAAAAAAA= --shared-files       59MiB |
+-----------------------------------------------------------------------------+

我尝试过本 Medium 指南要将 CUDA 降级到 11.0,请使用这些来自 NVIDIA 的说明安装我想要的版本。但有几件事让我感到困惑:

  • 为什么 Medium 指南告诉我删除 nvidia?我想保留驱动程序原样,只需更改 CUDA。
  • 看起来rm -rf也很吓人。感觉不对劲。是吗?
  • 我在尝试安装 CUDA 11.0 时最终收到错误。这是因为缺少许多依赖项。我不再拥有它了,因为我已经跳槽并清除了所有内容以重新开始。

答案1

除了 Alexander 关于取消勾选驱动程序选项的回答外,还有一个屏幕截图,您可以在其中执行此操作。(在 Ubuntu 22.04 上安装 CUDA 11.6 运行文件)

CUDA Install 禁用驱动程序安装

相关内容