需要注意的是,我目前没有遇到问题,但以前遇到过,所以引起了我的好奇心......
当计算机突然锁定,大写锁定键不断闪烁,唯一的选择是重新启动....您如何排除故障?在 Windows 上,事件日志中会有一些错误...在 Linux 上,似乎没有机会将任何内容写入日志,这使得排除故障变得困难...
那么,如何通过Linux来解决问题呢?
答案1
尝试从可启动媒体启动 memtest86+,看看它对您的内存和内存子系统完整性有何评价。
此外,最后启动的作业可能会在 Cron 中记录到 /var/log/syslog 或 /var/log/messages。
如果没有,并且正在持续调试此问题,您可以设置 auditd 和带有 ps 的 cron 作业来记录系统活动以及正在持续运行的作业。
答案2
内核设备会将问题报告给dmesg
,也可能被单独记录,或者记录在 中kern.log
。
对于严重的问题,POST 诊断板可能用过了。
答案3
正如 kmarsh 所说,日志是首先要查看的地方,但是如果在发生严重硬件故障时日志没有提供太多信息,那么使用什么操作系统并不重要,只需要进行一些老式的反复试验。
通过运行实时 CD 来确定是否是硬件问题,否则可能是驱动程序问题被误诊为硬件故障。
硬件死机是随机的,但很常见。我会先移除显卡(使用板载或备用卡)、网卡或(天哪)调制解调器(如果有的话),一次移除一个,直到找出罪魁祸首。每次只使用一个内存条(如果有 x2)或在测试时换成其他内存条。
您的 PSU 也可能出现故障,有时添加新卡会消耗大量电力,如果 PSU 功率不够大,则会导致 CPU 缺电,从而导致随机故障。
如果没有其他线索,则可能是您的主板(如果已经超过 2 年,则通常会发生腐蚀,具体取决于您居住地的湿度)或 CPU。
使用软件监控 CPU 温度,过热也会导致死机。
尝试了所有方法却没有成功之后,也许是时候买一台新电脑了;)
答案4
如今,每当之前正常工作的设置开始出现问题时,我甚至懒得先阅读日志或类似的东西。如今,驱动程序质量等都非常好,大多数突然死亡的错误都已得到解决,硬件问题比软件错误更有可能发生。即使是最完美的代码也无法对抗物理问题。
前段时间,我的笔记本电脑开始出现异常。在看电影、编译代码或执行任何相对 CPU 密集型操作时,一切都突然变得慢了很多。移动窗口需要 1-15 秒。CPU 频率从 2 GHz 降至 800 MHz,并决定保持在该频率。即使空闲温度也在 +60C 左右。时不时地,整个系统确实会锁定。
清理笔记本电脑内部的灰尘后一切恢复正常。空闲温度 +35-40C,无减速。
好的,由于笔记本电脑内部的热量和过多的灰尘,这个问题很容易追踪。:-)
如果出现更棘手的问题,我通常会先让 memtest86 运行一整夜,看看是否能得到结果。如果没有结果,我会启动 cpuburn 或类似的程序,看看是否会使我的计算机崩溃。如果这没有帮助,我会继续使用 bonnie++ 或 iozone 折磨硬盘,看看是否会导致某些东西崩溃。然后我会继续进行 3D 测试,例如玩 PPRacer。
如果在所有这些测试之后我都无法控制崩溃,我就会继续检查更模糊的东西。也许是 USB 自动暂停导致的?或者是更奇怪的事情。
有一次,每次启动网络摄像头软件时,计算机都会锁定。在花费太多时间配置内核参数等之后,系统盘令人尴尬的是,摄像头连接到的是 USB 1.1 端口,而不是 USB 2.0 端口。将摄像头连接到 USB 2.0 端口后,它就开始工作了。