如何调试 Linux 上的神秘崩溃?

如何调试 Linux 上的神秘崩溃?

几个月来,我的台式机(运行 Arch Linux)一直以随机间隔出现神秘的系统死机现象,我不知道从哪里开始调试。起初,我以为是 ATI Catalyst 出了问题(我听说很多人遇到过这种问题,但在使用之前似乎没有遇到过问题),因为在崩溃之前,屏幕总是闪烁,然后出现一些随机的屏幕伪影。

但购买新显卡(这次是 NVIDIA)后,我仍然遇到问题。dmesg锁定后查看没有发现任何问题,Xorg.n.log 文件也是如此。我运行了 memtest86,但没有发现任何问题。

为了澄清我所说的“锁定”的意思:

  • 键盘和鼠标输入无效(虽然偶尔我可以移动鼠标,但仅此而已)
  • 我无法通过 ssh 登录

我该如何调试崩溃?崩溃发生的时间似乎相当随机,因此没有简单的方法可以重现它并尝试不同的调试方法。有没有办法生成更详细的日志来揭示一些信息?我遗漏了哪些日志文件?

答案1

您是否对处理器和/或内存进行了超频?进入 BIOS 并确保两者都设置为默认电压和频率。

答案2

有时内存错误会逃避 memtest。superuser 上有一个关于此问题的故事,但我现在找不到它。如果您有多个内存模块,请尝试移除其中一个,然后检查崩溃是否仍然发生。

相关内容