现代(截至 2020 年)SSD 上的坏簇是否表示硬件故障?

现代(截至 2020 年)SSD 上的坏簇是否表示硬件故障?

我有一块三星 970 Evo 2TB SSD,在大部分读取负载下,已经完美运行了一年半。

最近,在将 Windows 更新到 2004 版时,操作系统陷入了回滚循环。我尝试使用命令提示符修复它,但 chkdsk 发现了很多坏簇,WinRE 中出现了臭名昭著的“未指定 75736...”错误,chkdsk 无法修复这些簇。

从单独驱动器(我现在正在运行)上的 Windows 安装扫描驱动器,发现并修复了大量坏簇,它们都位于 Windows 分区(由错误更新解释)和仅存储第三方软件的第二个分区(未由更新解释)。SMART 非常完美。一些重复扫描无法修复坏块,并再次出现相同错误。

对于 HDD,我预计这表明磁盘出现故障。但我的理解是,现代 SSD 在内部管理其好块和坏块(比现代 HDD 管理的程度要大得多),因为 NAND 内存在正常运行过程中一直在缓慢出现故障,如果没有这一层,SSD 就无法像普通驱动器一样工作。操作系统能够发现控制器无法发现的错误,这似乎很奇怪。

它是速度最快的 PCI-E SSD 之一,而且 500 美元的价格并不符合简单的 HDD 格言“如有疑问,就扔掉它”。如果可以的话,我更愿意尝试保持驱动器可用。它有制造商保修,但如果驱动器有缺陷,则很难通过完美的 SMART 证明。数据不是问题,完整的数据已被复制。我也对这个主题的常识感兴趣。

此时,SSD 上的坏簇是否仍然是硬件问题的征兆,或者现代控制器是否会向最终用户隐藏此类故障?

答案1

SMART 中未显示的死块通常是由于 SATA 电缆故障/质量差(并不罕见)或主板上的 SATA 控制器(非常罕见并且通常也伴有其他稳定性问题)造成的。

您可以尝试更换 SATA 电缆,看看是否有帮助。

但通常情况下,当操作系统看到“坏块”时,磁盘就已经坏了。

不管它是 HDD 还是 SSD。

驱动器固件应该将坏块重新映射到其内部的“备用块”库存中。如果操作系统发现坏块,则库存已用尽,或者驱动器固件存在内部问题,导致其无法进行重新映射。
无论如何,磁盘不再可靠。

由于 SSD 刚使用 18 个月,可能仍在工厂保修期内,因此请联系三星技术支持。他们也许能够做出更好的诊断。

但无论如何……我会将重要数据复制到另一个磁盘并尽快更换此 SSD。对我来说,我的数据比另一个 SSD 的价格更有价值。

请重新安装 Windows。(无论您是保留驱动器还是更换驱动器。)
无法确定哪些文件已损坏以及 Windows 和其他软件现在的可靠性如何。很有可能存在各种隐藏的问题,这些问题不会立即显示出来,但如果您不重新安装,这些问题将在未来几个月内困扰您。

答案2

现代(截至 2020 年)SSD 上的坏簇是否表示硬件故障?

此时,SSD 上的坏簇是否仍然是硬件问题的征兆,或者现代控制器是否会向最终用户隐藏此类故障?

2021 年,这两种情况都发生过很多次。它们可能会漏网,频率取决于质量。这既是因为中低端笔记本电脑总是使用较旧的硬件,也是因为一些新设备制造得很便宜。例如,同一制造商的“Plus”驱动器与“Ultra 3D”驱动器,价格差异只有 10%,但硬件未检测到故障的概率却有很大差异。

此外,即使是生产优质产品的制造商,偶尔也会有质量不合格的产品(例如,某些旗舰手机在使用第三方或飞机充电器时会起火)。

操作系统能够发现控制器无法发现的错误,这似乎很奇怪。

我发现这种情况在非常大的文件上更常见,我猜控制器的内存或识别某个特定点之后的文件的能力有限。更糟糕的是,如果单个多 GB 文件中有多个坏簇(通常不连续),则必须多次运行 chkdsk 才能找到所有坏簇。我认为这似乎是 chkdsk 的一个缺点。

一些重复的扫描无法修复坏块并再次出现相同的错误。

我遇到过三种情况:

  1. 您可以通过在扫描文件后尝试复制文件来测试是否“取得进展”。通常,每次运行 chkdsk 时,您都可以在再次出错之前复制更多文件。上次发生这种情况时,文件大小为 37.8GB,我扫描了 7 次才将其复制到安全位置。第一次运行它时:Adding 2964 bad clusters to the Bad Clusters File.最后一次运行时:Adding 19 bad clusters to the Bad Clusters File.每次数字都应该下降。

  2. 如果数字没有下降,则可能是驱动器已损坏,请删除所有可以删除的数据。谢天谢地,您无需专业设备即可读取任何数据。

  3. 有时固件会有缺陷。由于您已经读取了 SMART,因此您使用的同一软件很有可能有更新硬盘固件的地方。检查一下——如果有固件更新,一旦您删除了所有可以删除的文件,就更新固件,然后对硬盘进行彻底擦除(慢速格式化)。使用更新的固件,硬盘实际上可能会持续更长时间。

但我担心的是坏簇的 SSD 是否坏了。如果是,我应该尝试使用保修。

在我上一份工作(维修店)中,10% 的新硬盘似乎出厂时就有一些坏簇,但这些通常不是问题。在初始 chkdsk 之后,它们会消失并且不会再次出现。不过,我处理的存储硬件中似乎有 30% 在头 3 年内出现了大量错误。

关于保修政策,随着时间的推移,集群错误是一个灰色地带,但你一定要寻找包装盒、收据或订单号,然后拨打保修热线,询问政策是什么,如果节省更换新设备的成本是否值得你花时间。

还有一件要记住的事情是,如果您将硬盘用于“服务器日志记录”、“视频监控”等用例,某些保修可能不涵盖您。

我也对该主题的常识感兴趣。

坏簇迟早会出现在所有东西上。当你第一次拿到 HDD/SSD/SD 卡时,至少尝试一次将其完全填满,然后删除所有内容,然后无论是否找到坏数据,都对其运行 chkdsk。这还将帮助你发现哪些媒体是假冒的或伪造的(显示 1TB 但实际上是 784GB,类似这样的有趣内容)。

然后运行 ​​chkdsk 会发现大部分出厂后的缺陷。之后你就可以正常使用它了。你需要注意的是,大约 8 个月后是否会出现新的坏簇。一旦这种情况开始发生,试着跟踪它们出现的频率,然后去保修或将 SSD 切换到只读数据使用。

相关内容