如何解读 HDD SMART 结果?

如何解读 HDD SMART 结果?

我的笔记本电脑最近变得有点不稳定,出于某种原因,我开始怀疑我的硬盘开始出现故障。在网上搜索了一番后,我在系统菜单中找到了 Ubuntu 的磁盘实用程序,并从中运行了漫长的 SMART 诊断程序。

但是,由于“磁盘实用程序”的文档非常差(palimpsest?),我不确定如何解释结果:

读取错误率超过5000万,但测试结果还不错?!

例如,读取错误率超过 5000 万(!),但评估结果却被评为“良好”。

那么有人能帮我解释一下如何解读这些测试的结果吗(尤其是标准化、最差、阈值和值数字)?或者告诉我他们对我的硬盘测试结果有何看法?(谢谢)

答案1

您对 SMART 的工作原理进行了很好的描述维基百科。简单介绍一下:

  • 值:这是控制器报告的原始值。通常这是一个容易理解的值(如通电时间或温度),但有时并非如此(如读取错误率)。不同的制造商可以使用不同的结构和含义来表示这些数据。

  • 标准化:这是上述值的标准化,因此值越高越好。因此,读取/错误率 114 优于 113。同样,硬盘如何将原始数据转换为标准化值取决于供应商。

  • 最差:最差规范化您的驱动器过去的值(其中 99 可能是出厂设置)。

  • 阈值:当规范化价值是降低超过此值则驱动器可能会出现故障。

所以,你的硬盘看起来没问题。读取错误率的值不是你的驱动器发生故障的次数,而是取决于你的磁盘制造商的一些数据结构。

答案2

是的,通常来说,读取错误率的原始值是无意义的。您要关注的值是重新分配的扇区数、待处理数和离线不可纠正数。这些是已经纠正、正在等待纠正或无法纠正的坏扇区数,而那里的原始值通常是有意义的,是扇区数。

如果读取扇区失败,则该扇区将变为待处理状态。下次尝试写入该扇区时,驱动器将尝试重写它,如果成功,则一切恢复正常。如果它无法正确写入扇区,则它将从备用池中重新分配该扇区。如果它无法做到这一点(也许备用池已经用完了?),则它只会变为脱机_不可纠正状态,尝试读取或写入它只会出错。

答案3

psusi 成功了。

如果您阅读 seagate.com 上的数据表(白皮书),您将了解硬盘是如何制造、测试的以及它们的实际工作方式。没有完美的硬盘,过去没有,将来也不会有(历史和事实)。在过去,我们必须从新驱动器盒中附带的纸质列表中将坏扇区输入硬盘控制器,这样控制器就会跳过它们。

现代硬盘有纠错功能。从第一天起,扇区就是坏的。

因此它们将它们映射出来,这意味着驱动器会跳过坏扇区。实际上,它们是“逻辑上被换出的”——坏扇区被映射到新的、好的、备用的柱面扇区(它有备用的柱面——将柱面视为磁道)。这一切对外界来说都是透明的——除了 SMART 实用程序。

每个制造商都可以随心所欲地做事,因此有些制造商将错误计数设置为零,即使在驱动器制造出来时可能存在 10 个坏扇区。

驱动器固件中有一个 3 次规则 - 它会读取一个扇区 3 次,如果 3 次都是坏的,那么它可能会在运行中执行“重新校准”,并再读取 3 次。如果驱动器仍然不正常,它会将该扇区映射到备用扇区之一。这在固件中很深,但在后台持续发生,对用户来说都是透明的。

制造商是否选择在出现 3 次错误读取时或校准后报告原始错误取决于他们。所以就像他上面所说的那样,除非您有许多相同类型的驱动器并且您看到一些奇怪的趋势,否则这并不重要。

要点 2:所有 HDD 都有自然读取错误,如果您愿意,也可以在 Seagate 上了解这一点。但它们都有运行中的错误。并再次读取,并且通常会通过 CRC 错误测试。如果没有,驱动器将尝试将其换出。如果你让磁盘保持凉爽,它将持续很长时间,并且你可能永远不会用完备用磁柱。但请注意 psusi 告诉你的!

我正在一台旧电脑上输入这些内容,它运行着有史以来第一批 1GB 硬盘之一。现在仍然很好。(我备份了)(从来没有缺少冷却……)热量是头号杀手,而电涌,我运行 UPS。干杯,祝你有个美好的一天。希望这对你有所帮助。(有没有见过 DatA General 硬盘崩溃?房间里充满了大量的铝棉、卷曲的提示?那时候很有趣……永远不会无聊……

相关内容