Nvidia 驱动程序问题(无法启动、nvidia-smi 无法检测到等等)

Nvidia 驱动程序问题(无法启动、nvidia-smi 无法检测到等等)

我对 Nvidia 驱动程序束手无策。我记得我很久以前就尝试过设置它们,但失败了,最后只能使用开源驱动程序。但是,我仍然不得不处理屏幕撕裂的问题,所以大约一年后,我决定一劳永逸地改用专有驱动程序。

首先,我创建了一个名为的文件/etc/modprobe.d/blacklist-nouveau.conf,其中包含以下两行以阻止内核加载 nouveau 模块:

blacklist nouveau
options nouveau modeset=0

然后我跑去sudo update-initramfs -u更新更改。

然后,我输入以下命令来删除设备上所有现有的 nvidia 驱动程序:

sudo apt-get remove --purge '^nvidia-.*'
sudo apt-get remove --purge '^libnvidia-.*'
sudo apt-get remove --purge '^cuda-.*'

然后,我使用 添加了 nvidia 驱动程序 ppa sudo add-apt-repository ppa:graphics-drivers。完成后,我使用 安装了最新的驱动程序sudo apt install nvidia-driver-530

但是,现在我遇到了问题。一旦我重新启动并启动到 Ubuntu(我正在运行 Windows 双启动),我就会看到黑屏。我必须进入 tty1 终端才能从此时与我的系统交互。如果我运行并sudo apt-get remove --purge '^nvidia-.*'重新启动,我的系统就可以正常加载。请注意,在这里的 tty1 中(在我清除 nvidia 驱动程序之前),nvidia-smi 会向我提供有关我的 nvidia 驱动程序的输出。

但是,如果我打开安全启动(之前是关闭的),那么我可以正常加载到图形登录屏幕并正常使用 Linux。但是,现在,如果我运行nvidia-smi,它会通知我:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

因此,我要么可以使用我的系统,但(显然)没有适当的 nvidia 驱动程序支持,要么驱动程序可以得到支持和读取,但系统无法加载。我不知道如何解决这个问题,有什么帮助吗?

调试信息(安全启动开启,nvidia-smi无法读取 nvidia 驱动程序)

我正在运行 ubuntu 20.04 LTS 版本。

的输出apt list --installed | grep nvidia

libnvidia-cfg1-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-common-530/focal-updates,focal-updates,focal-security,focal-security,focal,focal,now 530.41.03-0ubuntu0.20.04.2 all [installed,automatic]
libnvidia-compute-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-compute-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 i386 [installed,automatic]
libnvidia-decode-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-decode-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 i386 [installed,automatic]
libnvidia-encode-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-encode-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 i386 [installed,automatic]
libnvidia-extra-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-fbc1-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-fbc1-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 i386 [installed,automatic]
libnvidia-gl-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
libnvidia-gl-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 i386 [installed,automatic]
nvidia-compute-utils-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
nvidia-dkms-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
nvidia-driver-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed]
nvidia-kernel-common-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
nvidia-kernel-source-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
nvidia-prime/focal-updates,focal-updates,now 0.8.16~0.20.04.2 all [installed,automatic]
nvidia-settings/focal-updates,focal,now 470.57.01-0ubuntu0.20.04.3 amd64 [installed,automatic]
nvidia-utils-530/focal-updates,focal-security,focal,now 530.41.03-0ubuntu0.20.04.2 amd64 [installed,automatic]
xserver-xorg-video-nvidia-530/focal-updates,focal-security,focal,now

的输出lspci -v | grep "VGA controller"为:

00:02.0 VGA compatible controller: Intel Corporation UHD Graphics (rev 05) (prog-if 00 [VGA controller])
01:00.0 VGA compatible controller: NVIDIA Corporation TU106 [GeForce RTX 2060] (rev a1) (prog-if 00 [VGA controller])

答案1

RTX 4060 Ubuntu 22.04 LTS 也遇到了同样的问题。首先,将外接显示器插入笔记本电脑。

一旦您能够通过 ++ 进入 tty 终端Ctrl(在笔记本电脑上黑屏且带有白色光标时),请执行以下操作AltF3

sudo nvidia-xconfig

这是为了初始化并生成您的配置参数,如下所述https://manpages.ubuntu.com/manpages/jammy/man1/nvidia-xconfig.1.html。如果之前不存在,该nvidia-xconfig命令将生成 nvidia 配置文件/etc/X11/xorg.conf。您可以通过执行来查看配置文件的样子sudo nano /etc/X11/xorg.conf,并注意详细信息。

要使 GPU 识别外部显示器,请执行以下操作:

sudo nvidia-xconfig --enable-all-gpus

这将检查系统并为其找到的每个显示设备配置一个 X 屏幕。nano再次检查配置文件,您现在应该会看到显示 Section 的部分Device,其中的 NVIDIA GPU 显示在 BoardName 下。

然后重新启动系统:

sudo reboot

重新启动后,外接显示器现在应该可以显示,而笔记本电脑显示器仍处于黑屏状态。在 NVIDIA 更新 RTX 4060 的 Linux 内核解决这个问题之前,您现在应该可以正常工作。目前,最新的内核 5.15.0-84-generic 无法与 RTX 4060 很好地配合使用。您遇到的这个问题被广泛报道 - 自从我遇到这个问题以来,过去一周我已经阅读了很多这样的文章(Nvidia-smi failing to communicate )。按照下面链接中的步骤更新您的内核;我在“其他软件”中使用了 Liquorix 来获取“ppa”,如软件和更新下所示。在此处找到链接https://launchpad.net/~damentz/+archive/ubuntu/liquorix

相关内容