我已经运行了Ubuntu 22.10
几个月了,机器有一个 RTX 2080 TI GPU。
我正在使用nouveau
默认设置的驱动程序,一切运行正常,但我需要一些 nvidia 功能,例如nvidia-smi
和cuda toolkit
。
安装官方 nvidia 驱动程序会导致操作系统在使用桌面 GUI 时一分钟左右后冻结。如果我在 tty2 终端上,系统不会冻结。
使用安装时也会发生同样的事情apt install nvidia-driver-530
我尝试将损坏的系统升级为Ubuntu 23.04
使用do-upgrade-install
tty2 - 结果相同
我进行了全新安装22.04 LTS
- 结果相同,一旦我安装了官方驱动程序,系统就会崩溃。
使用官方的 nvidia 驱动程序,无论操作系统版本或内核版本(6.x 或 5.19.x)如何,我的系统都会冻结。
CPU: AMD 7950X
Motherboard: Asus PRIME X670E-PRO WIFI
GPU: RTX 2080 TI
GPU 没有硬件问题,在 Windows 压力下也能正常工作。
我该如何诊断/解决这个问题?
答案1
通过强力破解找到的解决方案可能不是最好的,欢迎发布其他解决方案。
tldr,硬删除nouveau
和amdgpu
内核模块。
较长的版本:
下载 NVIDIA 官方驱动程序。通过init 3
从终端或启动菜单运行,切换到运行级别 3。
删除驱动程序,为了安全起见,nouveau
我也删除了驱动程序 - 它是我的主板板载显卡。amdgpu
sudo apt purge xserver-xorg-video-nouveau
sudo apt purge xserver-xorg-video-amdgpu
apt purge
并没有真正删除内核模块(重启后可以使用 lsmod 进行验证) - 必须使用 .conf 文件将它们列入黑名单
sudo nano -w /etc/modprobe.d/blacklist-nouveau.conf
将文件内容设置为:
blacklist amdgpu
blacklist nouveau
options nouveau modeset=0
现在安装 Nvidia 驱动程序并重新启动
sudo apt install build-essential # if you dont have gcc installed
sudo apt install libglvnd-dev # Not mandatory
sudo ./NVIDIA-Linux-x86_64-525.116.03.run
init 6