无需 SysReq 即可诊断并修复随机 Ubuntu 崩溃?

无需 SysReq 即可诊断并修复随机 Ubuntu 崩溃?

我读过了这个问题并尝试遵循所选答案的建议。我也读过这个问题但我认为第二个问题与我的问题无关。(但我不确定。)

当 Ubuntu(或者可能只是 Unity)崩溃时,一切都会停止工作。我必须彻底打开和关闭机器。我无法执行 SysReq 软重启,因为我无法找到与我的键盘/笔记本电脑型号对应的按键。

我可以根据要求提供日志,但说实话,我不知道哪些日志有用,或者有多少日志有用。

我的电脑是戴尔 Inspiron 11 3000 系列。我相信是我的型号,在与我链接的列表交叉检查系统规格后得出的结论。该 PC 运行的是 Ubuntu 14.04 Trusty Tahr 的最新 LTS 版本。

起初我认为这只是在播放视频时才会发生的问题,但尽管系统在不播放视频时不会经常崩溃,但偶尔仍会崩溃。

我是一名软件工程师,所以我必须有一台可靠的计算机。我最近决定将公司所有非客户端特定代码开源,并将我的所有服务器都改为 Debian,还在我的主要工作站上安装了 Ubuntu。公司现在在其所有机器上使用 100% 开源软件。但是,如果我不能解决这个问题,我将被迫回到 Windows,对此我真的很沮丧。

  1. 对于 Ubuntu 新手来说,用通俗易懂的语言来描述诊断 Ubuntu 崩溃的步骤是什么?
  2. 一旦发现,我可以使用哪些资源来解决这些问题?
  3. 最后,我是否有可能被迫使用专有软件来解决这些问题?

谢谢。

答案1

这里没有提供足够的技术细节,只能提出建议。

首先,您必须确定它是由于安装/配置错误导致的操作系统问题还是由于硬件故障导致的硬件故障。

软件

在第一种情况下,您可以检查系统日志尝试:

  • /var/log/机航站楼:

    sudo nano /var/log/syslog
    
  • 如果您正在运行 GNOME,那么您可以使用“”工具通过 GUI 检查所有日志gnome-system-log,输入:

    gnome-system-log
    

    如果尚未安装,请输入:

    sudo apt-get install gnome-system-log
    
  • 还可以尝试通过在恢复模式下启动来复制问题,或者尝试另一个操作系统环境或其他安装,或者通过 ssh 进入系统以查看是否发生这种情况。如果发生这种情况,则可能是硬件问题,否则,请在操作系统日志中寻找线索。

硬件

如果是硬件故障,并且您已检查 RAM、HDD、CPU 温度正常,我建议您致电技术支持,如果您仍在保修期内就更好了。

让我想起了曾经遇到过的类似问题,尽管 Ubuntu 系统似乎随机“正常”,但还是出现大量随机崩溃,后来才发现是由于 RAM 故障造成的。

这似乎是内存硬件问题,内存问题很难检测。如果您还没有检查过它们。

诊断此问题的一种方法是检查你的RAM是使用内存测试应用程序。您通常可以在 Ubuntu LiveCD 或任何其他带有内存测试应用程序的实时 CD 的启动菜单中找到它。启动菜单出现后,您将看到检查内存 RAM 的选项,请选择:[Test Memory][MemTest86+]

如果内存确实有问题,窗口应用程序的下半部分至少会出现一行红色。另外,如果安装两个内存后没有发现内存错误,我建议单独测试每个内存并测试不同的插槽。这样,您肯定会知道是否有一个内存有缺陷。

答案2

我怀疑你的 GPU 过热了。让我们检查一下你的温度。

sudo apt-get update
sudo apt-get install psensor

请发布您的临时文件的截图。

答案3

在 Unbuntu 22.04 上

随机崩溃,与上述相同,......

<简短回答>
关闭英特尔虚拟化技术在你的 BIOS 设置中

<长答案>

tail -n 25 /var/log/syslog显示:

kernel: [  551.300388] DMAR: DRHD: handling fault status reg 2
kernel: [  551.300402] DMAR: [INTR-REMAP] Request device [03:00.0] fault index 18 [fault reason 38] Blocked an interrupt request due to source-id verification failure

发现几篇制造商文章(例如联想、惠普)将 DMA 争用归咎于线程之间的争用,英特尔虚拟化技术已在 Ubuntu 上启用。

相关内容