我的 Nvidia 驱动程序在重启后突然失效

我的 Nvidia 驱动程序在重启后突然失效

我重启了电脑,Ubuntu 突然被锁定在非常低的分辨率下,我无法玩任何游戏。在启动过程中,Linux 显示有关 Nvidia 的错误信息。发生了什么?

答案1

我遇到了这个问题一次并且非常困惑,但暂时解决了这个问题。几周后,这个问题再次发生,我研究了如何永久解决问题。就我而言,修复(临时和永久)非常简单。这些说明是为 Ubuntu 22.04 编写的,但可能适用于其他版本。

这些说明修复了哪些具体问题?

Ubuntu 有时会用新补丁更新您的内核(操作系统)。您可能甚至没有注意到这种情况的发生,因为它可能位于它要安装的其他更新的一大堆列表中,而您只是点击了“确定”,而没有想到它可能会完全破坏您的系统。问题是 Nvidia 驱动程序(内核模块)是为特定内核版本设计的。当内核更新时,需要再次安装它们。

我怎样才能知道这是否就是导致我出现问题的具体原因?

我建议的修复方法简单且无破坏性,所以您无论如何都可以尝试一下。但这是我最初的想法。查看文件夹的内容/lib/modules。我第一次遇到这种情况时,里面有两个文件夹:5.15.0-43-generic5.15.0-56-generic,对应两个不同的内核版本 - 旧版本( )和刚刚安装的43新版本( )。在文件夹中查找旧版本,特别是在子文件夹中(在我的情况下)。您应该会看到一些名称带有的文件(有关示例,请参阅我链接的问题)。现在检查最新版本的文件夹。如果找不到任何 nvidia 的东西,很有可能这就是发生在您身上的事情。56kernel/lib/modules/5.15.0-43-generic/kernelnvidia

我该如何暂时解决这个问题?

重新安装 nvidia 驱动程序。有时,您可以通过在命令行中运行 来执行此操作ubuntu-drivers install,但通常不起作用(它会告诉您已经安装了它们,而不是重新安装)。或者,您可以打开“附加驱动程序”程序,如下所示:

在此处输入图片描述

取消选择当前选定的驱动程序,然后重新选择它。点击“应用更改”。重新启动后,您的显卡应该可以再次工作。

请注意,在撰写本文时(2022 年 1 月),有一个非常尴尬的事件(自 2020 年以来一直如此!)解析错误ubuntu-drivers程序中。这个错误使程序在接触任何名称以-open-server或其他非数字结尾的 nvidia 驱动程序时完全失效(有几种,包括推荐的“经过测试”的驱动程序,如您在上面的屏幕截图中看到的那样)。这个错误的一个症状是上面的“附加驱动程序”程序可能无法运行。您的所有驱动程序都将变灰,窗口将显示类似“此计算机正在使用专有驱动程序”的内容(我不记得确切的消息)。我通过实际修改程序ubuntu-drivers(用 Python 编写)解决了这个错误。这也意味着您应该只安装名称以数字结尾的驱动程序的专有版本,而不是变-open体。正如您在屏幕截图中看到的,这就是我所做的。如果您认为这个错误阻止您完成此步骤并且无法弄清楚如何绕过它,请提出一个新问题。

我怎样才能永久解决这个问题?

知识管理系统是 Linux 中的一个软件对象,它的作用就是解决这个问题 - 在内核更新后保持驱动程序正常运行。我发现修复此问题只需安装 dkms:

sudo apt install dkms

然后按照上面“临时修复”部分中的说明重新安装 Nvidia 驱动程序。Nvidia 驱动程序安装将看到 DKMS 支持并自动利用它。您可能会在网上看到一些信息,建议执行此操作后,运行dkms status应打印有关 Nvidia 驱动程序的信息。就我而言,运行dkms status没有返回任何输出,但此修复似乎仍然有效。

我只是想解释一下为什么我认为这有效:在我之前链接的问题中,我提到这个问题导致我的两个驱动程序离线,一个是 Nvidia 驱动程序,另一个是 Wi-fi USB 适配器驱动程序,从而导致我的互联网连接中断。第二次发生这种情况后,我应用了上面的“永久修复”,我故意没有为 Wi-fi 驱动程序启用 DKMS。就在今天,内核补丁发布了,果然,重启后,我的 Wi-fi 就没了 - 但我的图形没问题。所以看来 DKMS 确实发挥了作用。


更新:2023 年 2 月 9 日,内核更新再次导致我的 Nvidia 驱动程序离线。问题可能与我的 Wi-Fi 驱动程序有关,因为当我尝试通过运行来修复问题时sudo ubuntu-drivers install,我遇到了网络错误(无法下载所需的内容),因为我的 Wi-Fi 当然也被更新破坏了。我修复了我的 Wi-Fi,然后正常运行了 ubuntu-drivers,它修复了图形。将继续监控。

更新:2023 年 2 月 17 日5.19.0-32导致我的 Wi-Fi 断线,但显卡没问题。自 9 号以来,我没有进行任何配置更改。

更新:2023 年 3 月 4 日5.19.0-35导致 Wi-Fi 和显卡都坏了。自 2 月 17 日起,我就没有进行过任何配置更改。另外值得注意的是,当我手动重新启动后,我得到了“(Ctrl+C) 取消正在进行的所有文件系统检查”提示,我认为这只会发生在您错误关闭系统时。

想法使用“附加驱动程序”程序进行修复是有效的,但实际上并没有。我的分辨率很好,但当我去玩游戏时它没有启动,并且设置中的 Ubuntu“关于”选项卡将图形列为“llvmpipe”。我再次尝试像以前一样重新安装我的驱动程序,但没有成功。所以我最终尝试了专有驱动程序,nvidia-driver-525因为在过去的某个时候我一定已经切换到了nvidia-driver-525-open。重新启动后,这有效了。“关于”选项卡现在列出了我的显卡的“图形”名称。所以看起来变-open体根本不起作用?

相关内容