我的 2TB 外置硬盘最近开始报告大量 0xC5(待处理扇区)错误(原始值:309),就在今天,它报告了一个无法纠正扇区错误(原始值:1),而重新分配的扇区数仍为 0。这可能无关紧要,但我的待处理扇区数也增加了 1。
如果我理解正确,硬盘固件确定为坏的待处理扇区会被重新分配(或重新映射),从而增加重新分配的扇区数。我很好奇为什么这个被我的硬盘确定为坏的扇区没有被重新分配,而只是被标记为不可纠正。这两个错误之间的明显区别是什么,为什么会报告一个而不是另一个?我得出不可纠正的扇区是错误的结论对吗?不是重新分配,并且驱动器仍将尝试使用该扇区并导致问题(例如,尝试读取/写入时停顿)?
答案1
你几乎完全正确,只是对 0xC5 的解释更加微妙。从维基百科:
“不稳定”扇区的数量(由于不可恢复的读取错误而等待重新映射)。如果随后成功读取了不稳定扇区,则重新映射该扇区,并减少此值。扇区上的读取错误不会立即重新映射该扇区(因为无法读取正确的值,因此不知道要重新映射的值,而且该值可能稍后才可读);相反,驱动器固件会记住需要重新映射该扇区,并在下次写入时重新映射它。[29] 但是,有些驱动器在写入时不会立即重新映射此类扇区;相反,驱动器将首先尝试写入问题扇区,如果写入操作成功,则该扇区将被标记为良好(在这种情况下,“重新分配事件计数”(0xC4)不会增加)。这是一个严重的缺点,因为如果这样的驱动器包含边缘扇区,这些扇区仅在成功写入操作后经过一段时间后才持续失败,那么驱动器将永远不会重新映射这些问题扇区。
如您所见,0xC5 扇区是仍有机会恢复其所含数据的扇区。从这个意义上讲,0xC5 上的数据冻结,当且仅当数据可读取时,才会进行重新映射,并且通过重新映射可以完全恢复文件的完整性
0xC6 则相反,
读取/写入扇区时无法纠正的错误总数。此属性值的上升表明磁盘表面存在缺陷和/或机械子系统存在问题。
文章前面说过:
Google 在 9 个月内对超过 100,000 个驱动器进行了研究,发现某些 SMART 信息与实际故障率之间存在相关性。在驱动器上出现第一个无法纠正的错误(SMART 属性 0xC6 或 198)后的 60 天内,驱动器发生故障的可能性平均比没有发生此类错误时高出 39 倍。
你应该注意到,这种错误的存在与否不是这是即将发生磁盘故障的有力指标,因为大部分(约三分之一)的 HDD 发生故障时都没有发出任何 SMART 警告。然而,一旦发生此类故障,接近失败的可能性就会高得多。
关于RAW_值:你很幸运,你的制造商以直观的方式使用它,IE作为此类错误的简单计数。您很幸运,因为 SMART 不是 T13/ATA 标准的一部分;RAW_VALUE 属性是 64 位数据,可以按照驱动器供应商希望的任何格式进行编码。Seagate(例如,我对此有一些经验)对其某些属性进行了编码;解码它们的公式未知且未记录。更糟糕的是,他们并不是唯一这样做的人。