如何诊断系统硬故障? Dell+Ubuntu

如何诊断系统硬故障? Dell+Ubuntu

我在一台戴尔 Vostro 420 台式机上安装了 Ubuntu 9.10,这台电脑刚用了一年多,我用它来处理一些普通的工作事务(电子邮件、网页、终端、文本编辑器)。时不时地,在完全随机的时间,它就会完全死机。非常严重。鼠标和键盘停止工作,光标停止闪烁,时钟停止移动。我所能做的就是按住机箱正面的电源按钮将其关闭。

有时,这种情况发生在连续运行几个月后;有时,这种情况发生在重启几分钟后,而我所做的只是打开终端查看日志文件,或者用 Firefox 进行谷歌搜索。每次,崩溃时 /var/log/messages 中都没有任何内容。这看起来像是硬件问题,事实上,几个月前我打开了盒子,摇晃了所有东西,问题消失了一段时间。但现在它又回来了。我进去检查了所有东西,取出每张 RAM 卡并重新安装。没有运气。我运行了所有系统诊断程序(长版本),一切都顺利通过。这个盒子里有东西搞砸了,但没有任何有用的日志或失败的测试,我怎么才能找到它呢?当然,戴尔不会帮助我,因为我用 Ubuntu 替换了 Windows。

您下一步将采取什么步骤来追踪这个问题?

答案1

以下是我在遇到与您类似的情况时始终遵循的清单:

  • 注意温度。上次我遇到这种问题时,我在 KDE 4.x 桌面上放了一个温度图,很快就发现速度减慢/挂起与温度密切相关。打开笔记本电脑并清理灰尘后,一切都恢复正常。

  • 风扇运转正常吗?检查风扇转速。

  • 某个应用程序是否突然非常迅速地占用了所有可用 RAM?通过您最喜欢的应用程序(sar、Gnome 系统监视器、mrtg 等)查看 HD 活动和内存使用情况。

  • 如果您启用了桌面效果,请尝试禁用它们,看看问题是否与 3D 加速有关。如果您启用了 3D,您可以尝试使用一些 3D 折磨来导致崩溃,例如安装和播放 tuxracer(或 ppracer,无论它现在叫什么)。

  • 如果挂起完全地随机,怀疑是电源/电池的问题。我的戴尔 Latitude D830 已经更换过一块电池,我是在 2007 年底买的。就我而言,电池在一天晚上就没电了 - 根本无法充电,笔记本电脑闪烁着一些奇怪的灯光,但我并不怀疑电池故障是否会导致突然死机。

如上所述,不稳定的 HD 可能导致各种奇怪的副作用。尝试一下smartctl -a /dev/sda(或无论您的 HD 是什么)。

答案2

坏的硬盘会导致死机。检查您的 SMART 状态并将其发布。请注意,许多硬盘在 SMART 状态没有任何迹象的情况下变得不稳定并发生故障。死机时硬盘灯是否常亮?您可以尝试从实时 CD 运行一段时间,看看是否可以重现死机。如果无法从实时 CD 重现,则可能是硬盘不稳定。密切关注系统温度也可能提供一些线索。天气暖和时系统崩溃的几率会更大吗?由于您在消息日志中看不到任何内容,因此这听起来不像是软件问题。

答案3

您可以设置一个在 USB 闪存盘上永久安装 Ubuntu(8-16 GB 就足够了)。
然后开始使用一段时间并从硬盘驱动器访问数据。
更改 BIOS 启动设置,先尝试 USB,然后尝试硬盘
(并且,记住不要让任何其他 USB 一直插着。不过,您可以进行几次尝试,找到 USB 端口中的第一个点,如果您将 Ubuntu USB 一直插在那里,我认为在启动时不会尝试其他 USB)。

使用微型 USB 闪存驱动器(像这样创见 T3如果外形尺寸是一个问题,则可以使用模型。

当您继续从 USB 启动的 Ubuntu 进行正常工作时,
请检查问题重现情况。
由于硬盘不在路径中,因此与其相关的任何问题都将被绕过。

相关内容