无法调试/重现 Ubuntu 崩溃

无法调试/重现 Ubuntu 崩溃

Ubuntu 崩溃总是让我不知所措。机器死机,鼠标无法移动。无法退出终端,无法退出 X,Apport 什么也没报告。

我已经尝试了数周来可靠地重现崩溃,但我无法确定任何模式。有时它可以工作几天。但通常当它崩溃时,它会在接下来的几次启动后约 5-10 分钟内再次崩溃。

这是一台全新的 Thinkpad T410。它预装了 Win 7,我保留了它,现在它与 Ubuntu 10.04 实现了双启动。

我尝试运行 Win 7 看看它是否会在那里崩溃,因为我认为这可能是硬件缺陷,但它并没有在那里崩溃。不过,由于崩溃发生得如此偶然,我并不排除这种可能性。

在 ubuntu 中我尝试了几个内核:2.6.32.(21-23) 和恢复模式,它们都存在这个问题。

我一直在谷歌上搜索并检查所有系统日志以寻找可疑的东西,但一无所获。日志中充斥着有关我的 wifi 卡的信息,但没有错误。

寻找下一步尝试的想法。

答案1

您试过 Memtest86 吗?如果您的系统随机锁定,则可能是 RAM 问题。运行一整夜,看看是否出现任何错误。

笔记本电脑还在保修期内吗?如果是,那就要求更换,因为现在烦人的问题以后会变成大问题。

答案2

与 MSW 类似,如果您正在运行 sshd,您可以尝试从另一台计算机(如果有可用的计算机)通过 ssh 进入您的计算机。可能是 X 只是冻结了,但计算机仍在响应。

在我使用 Linux 和帮助其他人解决 Linux 问题的这些年里,我只见过少数几次运行 Linux 的计算机实际上冻结(无法通过 SSH 进入)。这些情况几乎总是与硬件有关(除了我为了好玩而运行 forkbomb 的那次……还有一次是驱动程序问题,但我不记得它是否完全冻结了)。希望如果您可以通过 SSH 进入,您将有更多工具来诊断问题。如果您不能,那可能是硬件问题……不过看起来您已经检查过内存了,这是我的第一猜测。

另一个建议:尝试禁用 Compiz(可以在外观菜单中通过将特殊效果设置为无来完成)。

编辑:好吧,听起来这不仅仅是 X 崩溃了。但 Windows 可以正常工作,这一点很有意思。尝试断开尽可能多的硬件(打印机、wifi 卡等),然后禁用 wifi 驱动程序。关闭尽可能多的 Ubuntu 组件。也许卸载未使用的内核模块。禁用 X。关闭不需要的服务。如果问题仍然存在,至少您已经排除了一些可能性……如果没有,请尝试一次启用/重新连接一个东西。

这可能需要一点努力……一个更简单的方法可以解决问题,那就是全新安装 Ubuntu(如果您备份 /home/、/etc/ 和已安装应用程序的列表,您就不会知道有什么区别)。这可能无法解决问题,因为(听起来)您目前有一个相当新的安装,但如果它能解决问题,那么它承诺只需付出很少的努力。

答案3

打开X逃生舱:

$ gnome-keyboard-properties

然后是布局 ➤ 选项... ➤ 按键序列以关闭 X 服务器 ➤ 启用。如果 X 占用了您的机器(可能是通过视频驱动程序),这可能会让您退出以检查更多状态。

/var/log/Xorg.0.log并且~/.xsession-errors可能对您有用。最后,如果您的日志中充满了无线网卡消息,那不应该如此,不幸的是,这两者可能相关。发布一个 WiFi 错误及其频率的示例。

更新

我现在更倾向于糟糕的硬件、糟糕的视频驱动程序,并且强烈偏爱 Win7 驱动程序。如果您尝试为 nVidia Quadro 3100M 使用 Nouveau 实验驱动程序,请不要这样做。Canonical 确实在黄金时段之前就推动了这一点。

$ sudo apt-get remove  xserver-xorg-video-nouveau libdrm-nouveau1
$ sudo apt-get install jockey-gtk nvidia-current nvidia-settings \
                       xserver-xorg-video-nv

不用担心,如果apt-get remove您抱怨某些内容不存在,因为您不希望它们存在。我仍然希望查看您的 Xorg.0.log 文件。

更新 2

感谢 Xorg.log。NVS 3100M 显卡芯片T410 简直就是精神分裂症,因为它的行为就像 nVidia Quadro 或 Intel 8xx,具体取决于……某些东西。您的 X 服务器将其视为 Intel 芯片组。

(II) intel: Driver for Intel Integrated Graphics Chipsets: i810,

这应该可行,但谁知道呢。请确认您的 Windows 系统是否认为您的图形芯片是 nVidia 还是 Intel。我现在确信这是一个驱动程序错误。

答案4

我似乎已经解决了这个问题。自从安装新的 Ubuntu (10.10) 以来,我还没有遇到过崩溃。已经 2 周了。它使用的是内核 2.6.35-22 64 位。

我意识到这并不能回答我关于如何调试非常深层的崩溃的一般问题,但它解决了我的问题。

相关内容