我的构建存在明显的硬件错误,我不知道如何调试它。
系统:
- i5-4690k
- z97m-g43
- 2+1GB DDR3-1300
- 关键 m550 120GB 固态硬盘
- 海盗船 CX500M
- kubuntu 14.04 (64位)
症状:
- ubiquity(ubuntu 安装程序)声称 GRUB 安装失败,但显然并没有失败。
- 在观看 YouTube 视频后,计算机开始完全冻结,但能够恢复。在进行几次系统更新后,系统重新启动,这导致 kubuntu 一直卡在登录处
- 如果您不进行密集的操作,Live CD 可以正常工作,但是如果您进行密集的操作,它会完全锁定。
我在谷歌上随意搜索后做的事情:
- badblocks -v /dev/sda 没有报告错误
- memtest86+ 拒绝启动
有哪些通用策略可用于调试此类情况?
编辑:derp,我之前使用的是 2GB + 1GB 的内存条。现在我的症状减少了,但问题依然存在。
答案1
测试和测量。
除了系统不稳定之外没有其他特定错误,有时测试和测量是排除硬件问题的最有效方法。
首先,你需要能够按需重现问题。如果你不能重现问题,那么测量部分就会很困难。每 1 小时到 6 天崩溃一次的系统是最糟糕的!
以一种方式更改硬件,然后尝试重现问题。
首先移除所有不必要的外围设备。从主板、CPU、内存(一根)、电源、键盘、视频和显示器开始。分别测试每根内存条。交换视频卡。添加驱动器并只加载一个驱动器。尽可能交换任何部件。尝试安装不同的操作系统,如 Windows?检查冷却问题。确保所有驱动器连接良好。交换电缆。
最难的是 CPU 和主板,因为大多数人手头没有这些,它们可能会产生极其奇怪和难以捉摸的错误。我曾经有过无法很好地重现所需错误的情况,这使得事情几乎无法衡量。
重点是主板和 CPU 可能存在问题,您的症状表明问题与 CPU/主板有关。如果不是硬件,可能是 BIOS 设置?肯定是低级问题。
我遇到过与电源相关的硬盘写入错误;与 CPU 相关的锁定错误;与冷却(主板芯片组)相关的内存错误和驱动器错误。所有这些都通过进行更改和测试来解决。有时这需要购买零件进行测试和测量;不得不凭信心购买 CPU 和电源。
请注意,测试时要小心;就像我说的,我的 memtest 测试内存时出错。然后我的 seatools 测试驱动器时出错。我假设并非所有组件都同时出现故障,并发现芯片组上的散热器对灰尘堆积和气流很敏感。因此,仅仅因为内存出现错误,并不一定是内存有问题。其他测试也是如此。
最后,当所有日志和错误都显示出来时,进行测试和测量。祝你好运。