上周我的 Ubuntu 22.04.03 LTS 操作系统进行了更新,我的 nvidia-515 和 cuda 11.7 坏了。重新安装后,失败了。我卡住了,尝试调试并检查日志 - 这表明版本不匹配,但版本确实相同11.4.0。
是不是名称需要更改。将 cc 和 gcc 的别名强制为 x86_64 也没有改变任何东西。尝试了多次迭代,每次尝试后都重新启动,但无济于事。遗憾的是,使用“apt install nvidia-driver-515”不是一个选项,因为它会由于转换而安装 525。迫切需要带有 cuda 11.7 的 driver-515。
$ sudo ./cuda_11.7.0_515.43.04_linux.run
[Error - listed in nvidia-installer.log below]
$ vim /var/log/nvidia-installer.log
...
The kernel was built by: x86_64-linux-gnu-gcc-11 (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
You are using: cc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
$ ll /usr/bin/gcc
lrwxrwxrwx 1 root root 32 Aug 20 09:53 /usr/bin/gcc -> /usr/bin/x86_64-linux-gnu-gcc-11*
$ ll /usr/bin/cc
lrwxrwxrwx 1 root root 20 Aug 20 09:16 /usr/bin/cc -> /etc/alternatives/cc*
$ ll /etc/alternatives/cc
lrwxrwxrwx 1 root root 12 Aug 20 09:16 /etc/alternatives/cc -> /usr/bin/gcc*
$ gcc --version
gcc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
$ x86_64-linux-gnu-gcc-11 --version
x86_64-linux-gnu-gcc-11 (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 22.04.3 LTS
Release: 22.04
Codename: jammy
答案1
我的 cuda 安装最近也在系统更新后崩溃了。我使用的是 22.04,非常需要nvidia-驱动程序-535和 cuda 工具包12.1. 也许这对您来说适用于 driver-515 和 11.4。
我得到了和你一样的编译器不匹配错误,所以我手动更新了符号/usr/bin/gcc
链接gcc-11到gcc-12。
我删除并清除了所有 nvidia 驱动程序
sudo apt remove --purge '^nvidia-.*'
并重新启动以确认没有安装 nvidia 驱动程序。
然后我按照这里的说明进行操作:
如何在 Ubuntu 中安装 NVIDIA 和 CUDA 驱动程序?
本质上:
apt install nvidia-driver-535
- 重新启动以确认 driver-535 已到位
- 运行本地运行文件,忽略运行文件安装程序的警告并取消选择驱动程序:
sudo ./cuda_12.1.1_530.30.02_linux.run
目前,、nvidia-smi
和nvcc --version
所有 cuda-samples 均按设计运行。希望这对您也有帮助。