安装 CUDA 时,如何确定发行版、版本和架构参数?

安装 CUDA 时,如何确定发行版、版本和架构参数?

安装指南说运行以下命令:

sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb

但是我该如何填写distroversionarchitecture

答案1

如果你使用CUDA 下载网站并选择适当的选项(按顺序排列 Linux、x86-64、Ubuntu、16.04),它将显示您应该运行的确切命令:

在此处输入图片描述

  • 该发行版是 Ubuntu(16.04 或 14.04,取决于您所使用的版本,运行lsb_release -cd即可查看)。
  • 该版本基于您正在下载的 CUDA 版本。
  • 有关架构,请参阅如何找到我的电脑和 Ubuntu 的架构?- 使用uname -m

答案2

CUDA 下载站点仅反映 CUDA 的最新版本。您还应检查以下内容:

  1. 受到推崇的适用于您的硬件的驱动程序。对于我在 Ubuntu 20.04 上,我的 RTX 3090 显卡应该使用驱动程序版本 470。请参阅发行说明,表 3 为最高对应的 CUDA 版本。在我的情况下是 CUDA 11.4.x。
  2. 您的 CUDA 版本所需的 GCC。在 Ubuntu 20.04 上,默认 GCC 是9.x,所以我的最高 CUDA 版本是11.4.0(我不想安装较新的 GCC)。
  3. 如果您正在使用依赖于特定版本 CUDA 的其他软件包,也请检查这些软件包(例如,当前最新的 Pytorch 是使用 CUDA 11.3 编译的)。
  4. 请记下您选择的 CUDA 的驱动程序版本:对于11.3.1,驱动程序版本为465.19.01

下载网站告诉我使用cuda-repo-ubuntu2004-11-6-local_11.6.0-510.39.01-1_amd64.deb。我将相应地更改版本:

Distro:       ubuntu2004-11-6-local -> ubuntu2004-11-3-local
Version:      11.6.0-510.39.01-1    -> 11.3.1-465.19.01-1 (<CUDA version>-<driver version>)
Architecture: amd64 (no change)

因此我将下载站点的输出从:

wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda-repo-ubuntu2004-11-6-local_11.6.0-510.39.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-6-local_11.6.0-510.39.01-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-6-local/7fa2af80.pub

wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda-repo-ubuntu2004-11-3-local_11.3.1-465.19.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-3-local_11.3.1-465.19.01-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-3-local/7fa2af80.pub

如果你安装了错误的版本(例如 11.6)并且想要撤消,你可以使用

sudo apt remove cuda
sudo dpkg remove cuda
sudo apt-key remove /var/cuda-repo-ubuntu2004-11-6-local/7fa2af80.pub
sudo rm /etc/apt/sources.list.d/cuda-ubuntu2004-11-6-local.list
sudo rm -r /usr/local/cuda-11.6 
sudo rm /etc/alternatives/cuda /etc/alternatives/cuda-11

相关内容