如何解决 Linux 上的硬件问题?

如何解决 Linux 上的硬件问题?

需要注意的是,我目前没有遇到问题,但以前遇到过,所以引起了我的好奇心......

当计算机突然锁定,大写锁定键不断闪烁,唯一的选择是重新启动....您如何排除故障?在 Windows 上,事件日志中会有一些错误...在 Linux 上,似乎没有机会将任何内容写入日志,这使得排除故障变得困难...

那么,如何通过Linux来解决问题呢?

答案1

尝试从可启动媒体启动 memtest86+,看看它对您的内存和内存子系统完整性有何评价。

此外,最后启动的作业可能会在 Cron 中记录到 /var/log/syslog 或 /var/log/messages。

如果没有,并且正在持续调试此问题,您可以设置 auditd 和带有 ps 的 cron 作业来记录系统活动以及正在持续运行的作业。

答案2

内核设备会将问题报告给dmesg,也可能被单独记录,或者记录在 中kern.log

对于严重的问题,POST 诊断板可能用过了。

答案3

正如 kmarsh 所说,日志是首先要查看的地方,但是如果在发生严重硬件故障时日志没有提供太多信息,那么使用什么操作系统并不重要,只需要进行一些老式的反复试验。

通过运行实时 CD 来确定是否是硬件问题,否则可能是驱动程序问题被误诊为硬件故障。

硬件死机是随机的,但很常见。我会先移除显卡(使用板载或备用卡)、网卡或(天哪)调制解调器(如果有的话),一次移除一个,直到找出罪魁祸首。每次只使用一个内存条(如果有 x2)或在测试时换成其他内存条。

您的 PSU 也可能出现故障,有时添加新卡会消耗大量电力,如果 PSU 功率不够大,则会导致 CPU 缺电,从而导致随机故障。

如果没有其他线索,则可能是您的主板(如果已经超过 2 年,则通常会发生腐蚀,具体取决于您居住地的湿度)或 CPU。

使用软件监控 CPU 温度,过热也会导致死机。

尝试了所有方法却没有成功之后,也许是时候买一台新电脑了;)

答案4

如今,每当之前正常工作的设置开始出现问题时,我甚至懒得先阅读日志或类似的东西。如今,驱动程序质量等都非常好,大多数突然死亡的错误都已得到解决,硬件问题比软件错误更有可能发生。即使是最完美的代码也无法对抗物理问题。

前段时间,我的笔记本电脑开始出现异常。在看电影、编译代码或执行任何相对 CPU 密集型操作时,一切都突然变得慢了很多。移动窗口需要 1-15 秒。CPU 频率从 2 GHz 降至 800 MHz,并决定保持在该频率。即使空闲温度也在 +60C 左右。时不时地,整个系统确实会锁定。

清理笔记本电脑内部的灰尘后一切恢复正常。空闲温度 +35-40C,无减速。

好的,由于笔记本电脑内部的热量和过多的灰尘,这个问题很容易追踪。:-)

如果出现更棘手的问题,我通常会先让 memtest86 运行一整夜,看看是否能得到结果。如果没有结果,我会启动 cpuburn 或类似的程序,看看是否会使我的计算机崩溃。如果这没有帮助,我会继续使用 bonnie++ 或 iozone 折磨硬盘,看看是否会导致某些东西崩溃。然后我会继续进行 3D 测试,例如玩 PPRacer。

如果在所有这些测试之后我都无法控制崩溃,我就会继续检查更模糊的东西。也许是 USB 自动暂停导致的?或者是更奇怪的事情。

有一次,每次启动网络摄像头软件时,计算机都会锁定。在花费太多时间配置内核参数等之后,系统盘令人尴尬的是,摄像头连接到的是 USB 1.1 端口,而不是 USB 2.0 端口。将摄像头连接到 USB 2.0 端口后,它就开始工作了。

相关内容