与其他人一样,我对如何安装特定 CUDA 版本以进行深度学习的说明感到非常困惑。
当今的主要深度学习库(Tensorflow 和 PyTorch)不支持最新的 CUDA 版本 11.2。但是,当我在全新安装 Ubuntu 后安装推荐的 NVIDIA 驱动程序时,我最终默认获得了 CUDA 11.2,正如我在运行nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39 Driver Version: 460.39 CUDA Version: 11.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 3090 Off | 00000000:09:00.0 On | N/A |
| 30% 37C P8 40W / 350W | 443MiB / 24259MiB | 12% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 954 G /usr/lib/xorg/Xorg 59MiB |
| 0 N/A N/A 1470 G /usr/lib/xorg/Xorg 161MiB |
| 0 N/A N/A 1603 G /usr/bin/gnome-shell 125MiB |
| 0 N/A N/A 2031 G ...AAAAAAAAA= --shared-files 59MiB |
+-----------------------------------------------------------------------------+
我尝试过本 Medium 指南要将 CUDA 降级到 11.0,请使用这些来自 NVIDIA 的说明安装我想要的版本。但有几件事让我感到困惑:
- 为什么 Medium 指南告诉我删除 nvidia?我想保留驱动程序原样,只需更改 CUDA。
- 看起来
rm -rf
也很吓人。感觉不对劲。是吗? - 我在尝试安装 CUDA 11.0 时最终收到错误。这是因为缺少许多依赖项。我不再拥有它了,因为我已经跳槽并清除了所有内容以重新开始。