安装 Nvidia 驱动程序后,Ubuntu 内核崩溃/冻结

安装 Nvidia 驱动程序后,Ubuntu 内核崩溃/冻结

我已经运行了Ubuntu 22.10几个月了,机器有一个 RTX 2080 TI GPU。

我正在使用nouveau默认设置的驱动程序,一切运行正常,但我需要一些 nvidia 功能,例如nvidia-smicuda toolkit

安装官方 nvidia 驱动程序会导致操作系统在使用桌面 GUI 时一分钟左右后冻结。如果我在 tty2 终端上,系统不会冻结。

使用安装时也会发生同样的事情apt install nvidia-driver-530

我尝试将损坏的系统升级为Ubuntu 23.04使用do-upgrade-installtty2 - 结果相同

我进行了全新安装22.04 LTS- 结果相同,一旦我安装了官方驱动程序,系统就会崩溃。

使用官方的 nvidia 驱动程序,无论操作系统版本或内核版本(6.x 或 5.19.x)如何,我的系统都会冻结。

CPU: AMD 7950X
Motherboard: Asus PRIME X670E-PRO WIFI
GPU: RTX 2080 TI

GPU 没有硬件问题,在 Windows 压力下也能正常工作。

我该如何诊断/解决这个问题?

答案1

通过强力破解找到的解决方案可能不是最好的,欢迎发布其他解决方案。

tldr,硬删除nouveauamdgpu内核模块。

较长的版本:

下载 NVIDIA 官方驱动程序。通过init 3从终端或启动菜单运行,切换到运行级别 3。

删除驱动程序,为了安全起见,nouveau我也删除了驱动程序 - 它是我的主板板载显卡。amdgpu

sudo apt purge xserver-xorg-video-nouveau
sudo apt purge xserver-xorg-video-amdgpu

apt purge并没有真正删除内核模块(重启后可以使用 lsmod 进行验证) - 必须使用 .conf 文件将它们列入黑名单

sudo nano -w /etc/modprobe.d/blacklist-nouveau.conf

将文件内容设置为:

blacklist amdgpu
blacklist nouveau
options nouveau modeset=0

现在安装 Nvidia 驱动程序并重新启动

sudo apt install build-essential # if you dont have gcc installed
sudo apt install libglvnd-dev # Not mandatory
sudo ./NVIDIA-Linux-x86_64-525.116.03.run
init 6

相关内容