正常使用情况下,3 年的 SSD 突然在其 SMART 值中报告 3% 的健康状况(97%“使用百分比”)

正常使用情况下,3 年的 SSD 突然在其 SMART 值中报告 3% 的健康状况(97%“使用百分比”)

我想这是我第一次在 SuperUser 上发帖,而且我对这个主题不是很有经验,所以如果我第一次尝试时遗漏了一些细节,请谅解。

所以。我们有一台 3 年前的 HP 笔记本电脑,配备了 512 GB 的 Sk 海力士 SSD——它从来没有出现过任何问题,但现在,它的 SMART 值突然报告健康度为 3%(“使用百分比”为 97%)。我不是这方面的专家,但我认为它的年龄和使用情况并不能真正保证这一点:我的主要工作笔记本电脑有一个三星 SSD,它更老了(我想接近 5 年了?)并且每天承受着更大的压力(Web 开发),但它只报告了 10% 的“使用百分比”(考虑到它的年龄和使用情况,我认为这是正常的)。所以我真的不明白 Sk 海力士 SSD 是如何(以及为什么)突然跳升至 97% 的。

说实话,我真的不知道突然跳升至 97% 有多突然——那台笔记本电脑的运行状况没有得到密切监控(它基本上是一台上网机器,偶尔会编辑照片)——我们昨天才收到 Windows 的通知,说情况很糟糕,因为 SSD 的状况为 3%。我立即创建了一个备份(在正常计划之上),并安装了 Hard Disk Sentinel 以及 Sk hynix 自己的磁盘实用程序来检查:

HD Sentinel 概述

HD Sentinel 详细信息

SK海力士概况

SK海力士详情

我不确定我期望的是什么,但我有点希望其他 SMART 值能说明发生了什么。但至少在我看来,事实并非如此——除了使用百分比和严重警告外,一切似乎都很好。尽管 Sk hynix 程序确实说明了严重警告到底是什么(“可靠性”),但它在细节方面仍然相当低。

因此,问题是:

  • 我应该有多担心?假设我把所有重要的东西都存储在云端并经常备份,我还能安全地使用这个硬盘几个月吗,还是我应该立即订购一个新的?(考虑到这笔开支不小。)
  • 我之所以问这个问题,是因为我有点怀疑这个硬盘是由一个我从未听说过的品牌制造的。这可能是计划报废的简单案例吗(即笔记本电脑的保养包今年夏天过期了,所以也许固件只是决定它太旧了,无论实际磨损程度如何,都不能再使用了),还是真的有问题?如果是后者,还有其他 SMART 值或其他诊断工具,或者可能是一些日志,我可以检查吗?
  • 如果它真的坏了,是不是意味着这个品牌应该避免,或者我运气不好,买到了有故障的设备,或者是我对它做了什么“错事”?(例如,这台笔记本电脑几乎从未关机,只是进入睡眠状态,这会对 SSD 的使用寿命造成不利影响吗?)

谢谢!

答案1

已使用百分比:包含供应商根据实际使用情况和制造商对 NVM 寿命的预测对 NVM 子系统寿命使用百分比的特定估计。值为 100 表示 NVM 子系统中 NVM 的估计耐久性已耗尽,但可能并不表示 NVM 子系统发生故障。

来源:https://media.kingston.com/support/pdf/ssd-smart-attribute.pdf。我知道这是金士顿文档,但描述是 NVMe 规格的一部分。

https://nvmexpress.org/wp-content/uploads/NVM_Express_1_2_1_Gold_20160603.pdf

所以关键词是预言我认为是基于擦除/写入周期。这是一个有限的数字,例如取决于 NAND 的类型,但据我所知,它并不是一成不变的。其他 SMART 值表明驱动器尚未遇到无法读取和写入 NAND 的问题。

此外,它很难与其他 SSD 及其使用情况进行比较,它还与 NAND 芯片的质量、使用类型以及“写入放大”等因素有关。似乎 HD Sentinel 比 Hynix 软件更重视它?

关键警告值 4 或 0000 0100,因此第 3 位(02)设置:

位定义 00:如果设置为“1”,则可用备用空间已低于阈值。 01:如果设置为“1”,则温度高于过温阈值或低于低温阈值。02:如果设置为“1”,则表示由于严重的媒体相关错误或任何降低 NVM 子系统可靠性的内部错误,NVM 子系统的可靠性已经降低。03:如果设置为“1”,则表示介质已处于只读模式。04:如果设置为“1”,则表示易失性存储器备份设备发生故障。此字段仅在控制器具有易失性存储器备份解决方案时有效。

我假设它是由于接近估计的使用寿命而触发的。换句话说,驱动器本身认为它已经到了使用寿命的尽头。

那么人们应该有多担心呢?很难说,但我认为当前的警告是基于预测,而不是实际情况恶化。据我所知,这些预期寿命值是基于有限批次的测试和推断。

答案2

“写入的数据单位”字段显示,此驱动器在其使用寿命内已写入约 16TB。这比任何 SSD(即使是入门级 SSD)的标称耐用性要低得多。看起来很难找到此驱动器的规格,但根据经验,消费级 SSD 的耐用性约为其容量的 500 到 1000 倍:对于您的驱动器,这意味着 250 到 500 TB 的数据。您离这个还差得很远,16 TB 的写入量在 3% 到 6% 之间……所以我怀疑“已使用百分比”字段包含的正好相反,即“剩余百分比”。

答案3

听起来不是悲观主义,但只要你插入 SSD 并写入数据,它就会开始报废。硬盘健康度为 3% 更像是一个指标,表明你可能要开始考虑更换硬盘了,

您使用的写入次数还不到硬盘能够承受的写入次数的一半,因此硬盘并不是快要报废了,但您已经到了需要密切关注它的地步。一旦它下降到 50% 以下(从绿色变为黄色),可能就该开始认真考虑更换了。这并不是因为它可能会在下周就搞砸,而是因为您需要在更换之前进行备份。

不过,我并没有将时间考虑在内。如果该驱动器已使用五年,并且剩余电量为 3%,则可能再使用几年也没问题,但您需要定期检查。如果驱动器已使用一年左右,则情况会更紧急。尽快开始创建备份。

相关内容