如何用软件方法检查硬件错误?

如何用软件方法检查硬件错误?

如何仅使用软件解决方案检查坏块、坏内存等?我使用的是 Ubuntu 11.04。

答案1

检查一下badblocks您是否需要一个专门设计用于写入/读取驱动器的每个 LBA 的实用程序,并在此过程中测试错误。 badblocks提供无损和破坏性测试(如下所述,但它在现代硬盘驱动器上并不太有用)。

如果您想了解驱动器的 SMART 参数,请查看smartctl

据我所知,没有一款可以在 Linux 运行时运行的全面内存测试软件,但您可以启动到 memtest86+,这是一个备受推崇的实用程序,可以为您的 RAM 提供良好的全面测试。

编译 Linux 内核对 CPU 和 RAM 的压力都很大。如果在编译过程中随机位置出现错误(而不是可重现的错误),则可能表明存在 RAM 或 CPU 问题。

还有一个名为的实用程序,stress如果您想测试您的 CPU,它可以使您的系统充满线程,导致 CPU 使用率保持较高水平。

lm-sensors正确配置后,您可以查看温度、风扇速度和任何板载电压传感器等信息。

答案2

dmesg请注意,您应该在运行内存/CPU 压力测试时观察该实用程序的输出。如果存在内存错误,您将看到来自内核的令人讨厌的错误消息,特别是如果您的硬件配备了 ECC 功能。

相关内容