如何解读 SMART 和 Badblocks 结果

Question

很快：

原始值没有任何意义。它们可能因固件而异，除非您确切知道原始值对于特定硬件意味着什么，否则不要尝试解释它们。有时很明显（以摄氏度为单位的温度），但通常并非如此。
这些值以 100 为标准，越低越糟糕。如果值为 100 或以上，则无需担心。如果值低于 100，则硬盘有点磨损。如果值接近阈值或低于阈值，则需要担心。
所有硬盘都有原始读取错误。这是当今驱动器高密度化的结果，而这正是内置纠错功能的作用所在。
因此：您的原始读取率看起来不错。您的重新分配扇区率非常好，这意味着还没有发生什么严重的事情。一些重新分配的扇区无需担心。
由于某种原因，您的温度过高，请检查硬盘是否正确冷却。寻道错误率过高，这可能是由于温度过高导致金属膨胀，从而导致磁头位置偏离规格。

因此，您需要担心的一点是适当的冷却。如果您能做到这一点，寻道错误应该会减少，而我会保留硬盘。（但是，当然，您正在进行备份，不是吗？）

编辑

错误 1-4 来自 ATA 层上通信的最近五个错误的日志。通常您会得到类似这样的标题

SMART Error Log Version: 1
ATA Error Count: xxx (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]

因此，人们可以查找 ATA 标准中的命令和功能值，以了解有关所发生情况的更多详细信息。但偶尔发生错误本身并没有什么可担心的：嵌入式控制器很复杂，与主机的交互很复杂，时间也很复杂；如果发生一些奇怪的情况，那就是出现错误的一种方式。其他方式是嵌入式控制器固件中的错误，仅在这些奇怪的情况下才会触发。

只有当错误频繁发生并且持续发生时才需要担心，尤其是当总是出现相同的错误时。

您有三个错误发生在缓存刷新之后，一个发生在写入（LBA = 逻辑块地址）之后。两个错误同时发生，可能是由于同一个问题导致的，前后两个错误因此而独立发生。换做您，我会完全忽略这些错误：导致它们的原因已经过去，不会再发生了。

Answer 1

很快：

原始值没有任何意义。它们可能因固件而异，除非您确切知道原始值对于特定硬件意味着什么，否则不要尝试解释它们。有时很明显（以摄氏度为单位的温度），但通常并非如此。
这些值以 100 为标准，越低越糟糕。如果值为 100 或以上，则无需担心。如果值低于 100，则硬盘有点磨损。如果值接近阈值或低于阈值，则需要担心。
所有硬盘都有原始读取错误。这是当今驱动器高密度化的结果，而这正是内置纠错功能的作用所在。
因此：您的原始读取率看起来不错。您的重新分配扇区率非常好，这意味着还没有发生什么严重的事情。一些重新分配的扇区无需担心。
由于某种原因，您的温度过高，请检查硬盘是否正确冷却。寻道错误率过高，这可能是由于温度过高导致金属膨胀，从而导致磁头位置偏离规格。