18.04 Xorg 100% CPU 黑屏死机

18.04 Xorg 100% CPU 黑屏死机

大约两周前,我的系统开始出现黑屏挂起。

现在,登录后我只能使用几分钟,然后系统就会挂起。之后我无法使用 ATL-CTRL-# 切换到另一个控制台。我被迫从远程系统进行 ssh。从该系统我可以看到 Xorg 已 100% 并且无法使用 -9 将其关闭,因此只有电源按钮可以重新启动。

系统是 Alienware X18m R2,配备两个 Nvidia 675 和 24GB 内存

设置是:18.04 Ubuntu Gnome桌面 Nvidia驱动程序390.132 双启动到Windows 10

我尝试过以下解决方法:

Reinstalling the nvidia drivers.  
Trying another window manager. Now running light DM.  
Trying another desktop manager. Now running MATE.
Updated to latest recommended 18.04 kernel 5.3.0-51-generic

除运行 nouveau 驱动程序外,没有任何改变行为。

我注意到的是,使用越多,挂断就越频繁。当我说使用越多,即使快速上下滚动菜单也会导致这种情况发生。但是,监控温度和使用情况并不能揭示任何东西。无论如何,启动 Windows 时,相同的硬件可以可靠地运行。

我的下一个测试是重新安装带有 Nvidia 390 驱动程序的原始 Ubuntu 18.04。如果几天内运行正常,我会更新并查看结果。

还有其他想法吗?

答案1

我认为这篇文章已经讨论了解决您问题的方法,因为他对 CTRL+ALT+F1 也没有反应。我照原样复制粘贴。请参考帖子在 Ubuntu 18.04.2 LTS 上安装 Nvidia 驱动程序后启动时出现黑屏更多详细信息:

我发布了一个问题的答案,因为我设法解决了这个问题(感谢 AskUbuntu 社区)。这可能不是一个完全通用的答案,但我会解释我遵循的步骤,以防它能帮助别人。以下是我的做法:

1. 连接到终端

我按照说明在启动前编辑命令,即替换quiet splashnomodeset,然后按F10Ctrl+X启动(提供了说明这里)。启动后,我反复按Ctrl+Alt+F1Ctrl+Alt+F6Ctrl+Alt+F7。经过几次尝试(不得不重新启动并重试几次),我最终得到了一个分辨率极低的终端,我必须在其中输入我的登录名和密码,我照做了。

2.卸载错误的 Nvidia 驱动程序

我使用了提供的命令玛玛约吉卸载不正确的 Nvidia 驱动程序:

sudo apt-get purge nvidia*

下次我重新启动 Ubuntu 时,我能够以超低分辨率访问登录页面和 GUI,就像在我安装错误的 Nvidia 驱动程序之前一样。

3.安装正确的 Nvidia 驱动程序

在这里,我遵循了 Marmayogi 在他的评论中提供的说明,但 Nvidia 驱动程序的安装命令除外,因为它已经发生了变化,所以它是错误的(请参阅 Kerry Kobashi 的回答邮政详情请见):

  1. sudo add-apt-repository ppa:graphics-drivers/ppa
  2. sudo apt-get update
  3. sudo apt-get install nvidia-driver-410(这是新命令,也请先检查驱动程序的版本号!)
  4. 重启。

重启后,GUI 的分辨率恢复正常(除了 GRUB 仍然处于低分辨率,但问题不大)。为了检查一切是否顺利,我发出了以下命令:lsmod | grep nvidia,并且有输出,因此安装成功。

在这里我想强调的是,您需要检查您需要哪个版本的 Nvidia 驱动程序(即哪个与您的显卡兼容)。您可以查看Nvidia 网站每个驱动程序支持哪些产品(如果您有较新的显卡,则最新的驱动程序通常是最好的)。没有这样做,并且盲目地遵循另一篇未指定这一点的帖子中的说明,这首先导致我遇到所有这些问题(不幸的是,这一点在我看到的有关该主题的很多帖子中经常被忽略)。此外,在选择版本时,我读到某处说您只需写主版本(不要在意小数点后的数字,因此如果最新的驱动程序是 418.56,则只需写 418)。

答案2

谢谢大家的帮助。

最后我通过重建硬件解决了这个问题。M18x R2 有两张 nvidia 675m 卡,所以我把它们换了,因为 Linux 不支持移动型卡的 SLI。

现在一切似乎都正常了。

我无法解释为什么系统在 Windows 10 上运行没有问题。我只能猜测 Windows 驱动程序对硬件问题更宽容。

所以总结一下:怀疑是硬件问题。

相关内容