几年前,我的硬盘出现过故障,Windows 会警告我硬盘存在严重问题,并给我时间处理,否则,在我重新启动后,硬盘不能保证再次工作。这已经是 10 多年前的事了。
我已经使用 SSD 超过 6 年了,而且一直在使用它。它是 256 GB 的 SSD,到目前为止,我已经在上面写入了超过 170 TB 的数据。在 Windows 磁盘和驱动器设置中,我看到它仍然剩余 54% 的使用寿命,这真是太神奇了。
我想知道这个使用寿命数字到底有多可靠?我知道 Windows 设置使用 SMART 数据来估计剩余使用寿命,但是SSD 是否与 HDD 类似?它们是否会因为坏扇区或类似原因而突然出现故障?还是会随着时间的推移逐渐退化?我每隔几个月检查一次剩余寿命,有时它确实会下降 1%。
有关我的 SSD 的更多详细信息:
我的 SSD 的 TBW 为 160 TB,但我已经写入了 170 TB,SMART 显示剩余使用寿命为 54%。它几乎一直在 ~50.C 温度下运行。
答案1
您永远无法知道某个特定的驱动器何时会出现故障,或者它是否会缓慢地出现故障以挽救数据,还是会突然发生灾难性的故障。
SMART 实际上是一套“猜测”算法。它可以可靠地预测缓慢衰退,但永远无法预测突然的彻底失败。
您始终需要备份,并且需要定期测试其是否有效。等待警告并不可靠。如果驱动器已加密,这一点就变得更加重要,因为任何故障都可能破坏加密密钥,这意味着数据会立即完全丢失。
我最老的 SSD 现在已经用了大约 10 年了。当我查看数据时,它仍然显示“100% 健康”。我有两个独立的应用程序,每隔几个小时在后台检查 SMART 数据。
到目前为止,一切顺利。
我的内部备份每小时运行一次,我的异地备份每晚运行一次。我还会定期进行直接克隆。
有一天驱动器会出现故障。那时,我会订购一个新的,并在新驱动器到达后半小时内恢复运行,不会超过一小时的工作损失。
有一次,完全是巧合,两台机器上的两个启动驱动器在几个月内都坏了。两个驱动器都比较新,都是来自可靠的制造商。
两种情况都没有丢失任何东西。
答案2
SSD 磨损主要归因于写入的累积数据量。因此,供应商使用加速测试和统计模型来量化特定型号可以承受的写入数据量,并以 TBW(写入的 TB 数)为单位对该型号进行评级。SMART“剩余寿命”就是基于此:如果您已写入 170TB 并且剩余 54%,则您的驱动器可能约为 370TBW。
当驱动器达到给定的 TBW 且剩余寿命为 0% 时会发生什么?什么也不会发生... TBW 只是一个统计值,比如“在 TBW 之后,99% 的驱动器仍正常运行”(我不知道它是 99%、90% 还是 99.9%,但这是一个想法,具有给定的阈值):因此,您的特定驱动器完全有可能持续两倍于给定的 TBW(并且它也完全有可能在一半 TBW 后发生故障)。
还有其他 SMART 属性可以更好地帮助预测故障,例如读取错误率、待处理扇区数、重新分配扇区数……当其中一个开始增加时,您应该担心驱动器。请注意,一个坏扇区本身,甚至几个坏扇区,都不足以说明驱动器很快就会出现故障。
而且,SSD 也可能随时发生故障,没有任何警告,尽管所有 SMART 属性都正常。但它与任何电子或机械产品并无不同。
答案3
但是 SSD 是否像 HDD 一样,会不会因为出现坏扇区或类似情况而突然出现故障?还是会随着时间的推移逐渐退化?
它们肯定会随着时间的推移而退化这与有限数量的编程/擦除周期有关,这基本上是剩余寿命相关属性试图测量的内容。控制器将尝试使这种磨损均匀地发生在 NAND 上。
众所周知,例如,随着单元的 p/e 周期数增加,单元保留“数据”的能力会降低。换句话说,接近预计 EOL 的 SSD 与您购买时的 SSD 不同。因此,虽然这些单元仍然可以编程,但它们的状况比以前更糟糕。
因此,SSD 需要进行更多的维护,这本身也会导致磨损:这种数据保留能力的下降可以通过 SSD 定期刷新数据(巡逻)来抵消,这涉及读取数据并将其写入不同的位置,因此这个过程本身也会导致 p/e 周期的增加。
但固态硬盘也有可能突然失效例如由于固件错误、固件损坏、宇宙射线、突然断电、物理创伤、SMD 组件磨损等原因。
数据恢复实验室对 SSD 的恢复率明显低于传统 HDD,因此保留备份可能更为重要(无论如何都很重要,但你明白我的意思)。
关于这个具体案例,SMART 工具显示的健康分数基于 05 属性:
54% 是基于单身的RAW 值,属性 05“已使用百分比”,0x2E(十进制 46)- 该值随情况恶化而增加。保留的备用容量仍然 100% 可用(0x64)- 该值随情况恶化而下降。
我的 SSD 的 TBW 为 160 TB,但我已经写入了 170 TB,SMART 显示剩余使用寿命为 54%。
SSD 制造商改变规格和更换组件的情况并不少见。
答案4
过去十年中制造的每款主流 SSD 都有备用容量。确切数量各不相同,但新驱动器的备用容量约为 10%。这是必要的,因为写入 SSD 具有破坏性。SSD 将您的写入定向到备用容量,然后将覆盖的部分放回备用容量。磨损均衡可确保 SSD 的所有部分都得到平等写入。如果写入失败,因为某个扇区出现问题,则将其从备用容量中取出,并在另一个备用扇区上重试写入。
这意味着 SSD 可以将备用容量与坏扇区列表进行比较。如果您的 SSD 用完了备用块,它就无法再写入新数据。因此,该比率是预期寿命的简单而有效的衡量标准。
但 SSD 的其他部分也有可能出现故障,而且这些部分无法可靠地测量。因此,这种基于备用容量的使用寿命并不是不进行备份的借口。