如何安装nvidia-cuda-toolkit的匹配版本?

如何安装nvidia-cuda-toolkit的匹配版本?

我已经为我的系统(Ubuntu 22)安装了 NVIDIA 驱动程序,如下所示:

以非图形模式重新启动系统:

sudo systemctl set-default multi-user.target
reboot 0

运行安装脚本。

以图形模式重新启动:

sudo systemctl set-default graphical.target
reboot 0

我想安装 nvidia-cuda-toolkit 的匹配版本,但我不确定如何安装。我认为我的包管理器(apt)无法工作,因为我没有通过 apt 安装 cuda。此外,我尝试通过网站安装:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda-repo-ubuntu2204-11-7-local_11.7.1-515.65.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-7-local_11.7.1-515.65.01-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda

但这只是破坏了我本地的 CUDA 安装。如何安装正确(匹配)版本的 nvidia-cuda-tookit?

答案1

由于我的评论没有得到答复,我将假设没有充分的理由从一开始就直接绕过包管理器,其中包括安装 nvidia 专有驱动程序。
考虑到软件的这个非常特殊的部分,一个给定版本与某个给定版本的内核以及某个给定版本的 xorg 的已知和反复出现的问题……最好是让包管理器处理您实际面临的所有兼容性问题。
因此,(对于 ubuntu)更喜欢:而不是运行 nvidia 安装程序脚本:

$ sudo ubuntu-drivers autoinstall

为了自动安装推荐的版本(这可能是与您的硬件兼容的最新稳定版本)或

$ sudo apt install nvidia-driver-somepreciseversion

如果您有任何正当理由不选择推荐版本。 (请注意首先检查一些精确的版本通过运行命令,可以在特定硬件的存储库中使用ubuntu drivers。)


现在关于您想要安装的 nvidia-cuda-toolkit...以同样的方式进行怎么样?

请注意,即使nvidia 建议优先选择特定于发行版的软件包,而不是与发行版无关的下载。

独立于发行版的软件包的优点是可以在更广泛的 Linux 发行版上工作,但不会更新发行版的本机包管理系统。特定于发行版的包与发行版的本机包管理系统交互。建议尽可能使用特定于发行版的软件包。

因此,(在 Ubuntu 上)只需触发

$ sudo apt install nvidia-cuda-toolkit

并且忘记任何兼容性问题。


当然,您可能希望运行比包管理器建议的版本更新的工具包版本,并且需要您自己承担不受支持的风险。
顺便说一句,严格遵守nvidia 提供的说明和清单
如果有某些部分您很难理解,请随时在评论中提问。

然而,刚刚检查过,ubuntu 存储库中的最新可用版本是 11.5,11.7(最新的上游开发版本)实际上值得额外的白发吗……;-)


注意:我承认这个答案不符合赏金的特殊要求。然而,自从nvidia-cuda-toolkit 11.x 声称与 >= 450.80.02 nvidia-drivers 版本兼容并且OP报告已安装515.65,即使使用.run,也不用担心驱动程序不兼容。
而且,我知道OP(谁不知道515是否实际上与他们的硬件/内核/xorg兼容)更面临一些本地问题??? cuda 安装可能会被后来安装的 nvidia-cuda-toolkit 破坏。 (不考虑驱动程序)
据说,由于 nvidia 安装程序破坏了通过包管理器已经安装的任何版本,无论 nvidia-cuda-toolkit 安装是什么,都将是正常的。

相关内容