2.5英寸硬盘坏道不断增加

2.5英寸硬盘坏道不断增加

我的笔记本电脑上有 1TB 的硬盘,大约用了 2 年了。最近,我开始注意到硬盘随机挂起和冻结,​​然后检查了硬盘的健康状况。第一次检查时有 502 个坏扇区,然后每天都在增加,3 天内就跳到了 702 个。这是不是不好的征兆?这是否意味着硬盘可能很快就会坏掉?

在此处输入图片描述

更新型多巴胺

安装 Speccy 后。SMART 状态显示Warning,但每个属性都是Good,并且重新分配的扇区数增加到 750

更新型多巴胺

增加到807

答案1

我是这样对待 SMART 的(基于 20 年的数据恢复经验):

  • 如果 SMART 说一切正常,那么千万不要以为你的硬盘下一分钟不会死机。

  • 但是,如果 SMART 给出了需要谨慎的理由,则请像驱动器即将损坏一样进行操作。

换句话说,驱动器在没有 SMART 警告的情况下死机,但一些 SMART 值实际上可以帮助我们确定驱动器是否出现了问题。例如,重新分配的扇区和等待重新分配的扇区的值。这些是驱动器无论尝试什么都无法读取的扇区。

据我所知,这些属性的 RAW 值只是一个计数。如果我们看到 0xFF,我们就知道发生了 255 次重新分配,就这么简单。一些制造商可能会对某些属性采用更复杂的 RAW 值(例子),但根据我的经验,这些情况并非如此。

在这个问题中,我们不仅看到大量的重新分配,虽然这是任意的,有人说 700 左右的重新分配并不多,我们还看到它们迅速增加。在我看来,这个数字速度令人担忧。这就是我相信硬盘正在消亡的原因。

如果患者有伤口,血压可能需要一段时间才能降至临界值以下。但如果我们同时发现患者大量失血,我们不会等到他的血压低于临界值,而是立即采取行动,尽量防止情况恶化。

每次驱动器遇到无法读取的扇区,并且无法对其进行 ECC 更正时,驱动器就会启动所谓的错误更正程序。操作系统只能等待这些扇区,因此这可能会导致明显的挂断。这些程序每个扇区至少需要几秒,最多可能需要 20 秒。

只需读取“即将报废的驱动器”中的数据,您就会将其推向边缘。因此,您最好让每次读取都有意义,而不要浪费时间进行磁盘表面扫描。数据恢复工程师会将这样的驱动器连接到专用硬件磁盘映像器,并尽可能跳过坏扇区。我们能最接近这种专用硬件的可能是开源工具 HDDSuperClone。

因此,如果您需要此驱动器中的数据,我的建议是使用此软件尽快克隆它。如果您不需要,我会更换它。

编辑:这似乎可能是 SMR 驱动器。一旦 SMR 驱动器发生故障,即使通过数据恢复实验室,恢复数据也常常很困难。

答案2

这里可能有太多关于解释您的 SMART 值的讨论,而不是讨论确定磁盘状况所必需的内容。

在诊断坏硬盘的 30 年里,我很少使用 SMART 值来诊断。事实上,那时它甚至还不存在。这并不是说 SMART 统计数据没有价值,但您可以看到它造成的混乱。SMART 的问题在于每个制造商都以不同的方式实现它,除非制造商自己的规范有记录,或者他们自己的工具可以解释它们,否则几乎不可能确切地知道您正在查看什么。

我的建议是表面扫描在磁盘上。表面扫描,在某些工具中有时称为“长测试”,将物理读取(并可选地写入)磁盘上的每个物理扇区,以帮助确定驱动器的状况。这种类型的测试主要用于硬盘,对 SSD 几乎没有价值,尽管我曾经能够通过表面扫描检测到一次坏的 SSD,否则它会通过其他诊断工具。

第一的,一个警告。如果您的驱动器有坏扇区,此测试将找到它们。如果您的驱动器出现故障,则可能有数百个坏扇区。在出现故障的驱动器上运行此测试会使情况变得更糟。数据恢复和备份是第一要务!在对磁盘运行表面扫描之前,请先使用磁盘备份或克隆来挽救数据。

现在,有许多工具可以执行这些测试。大多数制造商都会发布自己的工具来执行此类测试,还有其他商业和免费产品可供选择。当我定期执行此操作时,我最近使用了一种名为 HDD Regenerator 的工具。在此之前,我们使用了一种名为 SpinRite 的工具。此外,还有 Seagate Seatools、Western Digital Data LifeGuard Tools 和许多其他工具。但是,我还是会使用一种名为硬盘扫描适用于简单的基于 Windows 的测试,尤其适用于最终用户。

那么,如何使用 HDDScan 来确定您的驱动器是好还是坏?

获取工具并开始测试:

  • 导航https://hddscan.com并下载该工具的.zip文件。
  • 该工具不需要安装在您的计算机上。相反,您可以使用您喜欢的工具解压下载的 .zip 文件,或者右键单击下载的 .zip 文件并选择“全部提取”,然后按照说明进行操作。
  • 现在,您应该可以在计算机的文件夹中找到解压的 HDDScan 文件。 在此处输入图片描述
  • 双击 HDDScan.exe 文件运行该应用程序。HDDScan 需要您计算机的管理权限,系统将提示您允许该应用程序对您的计算机进行更改。
  • 接受许可协议。
  • 您看到的第一页是驱动器和测试选择页面。从下拉列表中选择您的驱动器,然后选择“测试”按钮。然后选择“验证”测试。 在此处输入图片描述
  • 下一页将允许您选择要测试的扇区范围。在这种情况下,默认为整个磁盘,您可以单击右箭头继续。在开始测试之前,请务必关闭计算机上的所有其他应用程序,以获得更准确的结果,并避免可能导致扇区读取时间偏离的瞬时读/写。 在此处输入图片描述
  • 测试将立即开始,您将在任务列表视图中看到该任务。 在此处输入图片描述
  • 双击正在运行的任务以打开实时视图。您也可以在这里暂停和停止测试。 在此处输入图片描述

您如何解释这些结果?

首先,让测试完成。这将花费相当长的时间。但是,您应该偶尔监控一下。如前所述,此测试将发现存在坏扇区的情况。如果它开始发现很多坏扇区(>10),您可以停止测试。驱动器出现故障。继续破坏它是没有意义的。

测试完成后,您可以查看统计数据。测试状态窗口有三个选项卡:图表、地图和报告。

图表选项卡。 此选项卡显示测试过程中的测试速度(单位为 KB/s)。我们预计驱动器在整个测试过程中应保持相当一致的读取速度。瞬时峰值可能不表示存在问题,可能是 Windows 在扫描期间发生的其他磁盘访问的产物。还值得注意的是,由于物理磁盘的外边缘比内边缘旋转得更快,因此您可能会在测试过程中看到速度上升或下降的效果。

读取速度长时间下降清楚表明驱动器在读取磁盘表面时可能遇到了问题。

地图选项卡。 此视图可能是最有用的。在这里,您可以实时查看读取的每个扇区的状态,包括读取扇区所用的时间,以及是否检测到任何坏扇区。在此视图中,我们主要对右侧的统计数据感兴趣。

在此处输入图片描述

此图表显示测试期间以特定速度读取的扇区数量。到目前为止,在正常工作的驱动器上,大多数读取时间应少于 10 毫秒。默认情况下,任何读取时间超过 50 毫秒的扇区都会在“报告”选项卡上创建日志条目。读取时间超过 50 毫秒的扇区不一定是坏的。同样,因为这是在运行的 Windows 系统上,您的驱动器可能在测试期间被积极使用,这会影响读取速度。但是,如果您开始看到大量扇区(尤其是连续的扇区)花费超过 150 毫秒或更糟,超过 500 毫秒,那么这是一个非常明显的迹象,表明驱动器在读取驱动器的这个区域时遇到了问题。

最后,“坏扇区”的数量是检测到的坏扇区数量。这些扇区是驱动器无法读取的扇区,并且该扇区中的数据很可能已丢失。虽然读取时间缓慢可能表示存在问题,但坏扇区数量清楚地表明驱动器的磁盘表面存在物理损坏。

报告选项卡。

此选项卡显示所有相关事件的日志。无论是坏扇区还是读取时间异常长的扇区,此日志都会向您显示您可能需要关注的驱动器事项的摘要。

什么情况表明驱动器有问题?

这里个人经验和偏好的空间很小。但是,一般的经验法则是,读取速度慢的扇区(>150ms)和坏扇区表明驱动器存在物理问题。但是,很难在这里制定严格的规则。驱动器确实有一个专门用于处理坏扇区的备用扇区池。驱动器将自动锁定坏扇区并将其重新映射到好扇区。在某种程度上,这些小故障是可以预料到的,驱动器无需任何用户干预即可处理。我有理由认为(但不确定),如果此测试中出现任何坏扇区,则驱动器已经耗尽了其备用扇区池。因此,确定何时更换驱动器有时取决于您的风险承受能力。

以下是我对测试结果的解读。

  • 如果驱动器在磁盘上检测到一两个坏扇区。我会担心驱动器开始出现故障。但是,我也知道驱动器可能经历了损坏该特定区域的单一事件(例如掉落或撞击),并且它很可能继续正常运行。如果是 2 或 3 个连续坏扇区,情况尤其如此。但是,这种类型的测试多次发现 1 或 2 个坏扇区,即使在将驱动器送回服务后,它也会很快出现故障。因此,在这种情况下,您需要决定您的风险承受能力,经常备份,并可能继续监控驱动器而不是更换它。
  • 如果驱动器有大量坏扇区,比如说 10 个或更多,尤其是当它们分散在驱动器上时。驱动器出现故障。是时候更换它了。
  • 如果驱动器有大量(超过 10 个)读取速度慢的扇区(>150ms),尤其是连续的扇区,这可能表明驱动器存在问题。如果没有发现坏扇区,我倾向于在将来继续监控。但是,当这些读取速度慢的区域与坏扇区结合在一起时,它们几乎与坏扇区一样明显是物理损坏的指标,应该算作相同的值。

最后,如果是我的驱动器出了问题,并且检测到任何坏扇区,我会立即更换驱动器。状态良好的驱动器在这些测试中永远不会出现读取速度慢或出现坏扇区的情况。事实上,如果检测到任何坏扇区,许多制造商的诊断工具都会使驱动器失效。

最后,如果您真的对 SMART 值感兴趣。记录测试前的数值,然后在测试后再次查看它们,这将是一个不错的实验。此测试将强制驱动器读取每个可用扇区,因此如果有任何问题,SMART 应该可以检测到它。

答案3

您的重新分配扇区数量为不是750。对于 SMART 值,100 表示“正常”,低于该值表示较差,低于指示的阈值表示“不合格”。原始值根本没有标准化。

一些硬盘,此属性的原始值实际上是重新分配的扇区的数量,但是它也可以是一些复合值,其中作为值一部分的不同位字段具有不同的含义(这也是为什么该值以十六进制显示的原因)。

因此,如果没有值低于 100,特别是如果没有其他值下降表示读取错误等(这是扇区重新分配的原因),您根本不必担心。警告是在欺骗您。

我开始注意到随机挂断和冻结,

可能还有其他原因,例如电缆安装不正确。您是否调查过导致挂断/冻结的系统错误?

答案4

以下是查看 SMART 属性之前和之后的两个答案。一个答案描述磁盘即将损坏,另一个答案描述磁盘不完美但仍处于工作状态。

这引发了相信 SMART 属性的人与不相信 SMART 属性的人之间的争论。

和往常一样,事实可能介于两者之间。应该密切关注磁盘是否进一步恶化,但目前没有迹象表明它会在不久的将来出现故障。

像 Speccy 这样能够分析 SMART 属性的产品是更可取的工具,而不是仅仅报告原始数据并让我们争论的工具。

关于重新分配扇区的数量:这与不可恢复扇区不同,并且严重程度低于不可恢复扇区。现代磁盘制造时有数千个备用扇区,这意味着它们可以从此类问题中恢复。当这些扇区耗尽并且无法映射更多扇区时,将到达无可挽回的地步。如果磁盘开始显示不可恢复扇区,并且其数量不断增加,则应更换。


是的,磁盘坏了。每天大约有一百个坏扇区,这非常令人担忧。

在数据彻底失效之前保存它。

请添加您看到坏扇区数量的屏幕截图,以便我能够确定我的预测。


根据截图,您的磁盘状况良好,没有任何错误。

你被 SMART 属性误导了。值 100、200 甚至有时 253 是规范化值表示“没有错误”。这是大多数 SMART 指示器的初始值,错误会导致它们下去为零。大多数情况下,原始值会被忽略 - 它们通常被分成位字段,因此将它们视为整数是没有意义的。

请不要更换磁盘 - 它没有任何问题。

相关内容