我经常听到有人说 SSD 扇区在损坏之前写入次数有限,尤其是与传统(旋转磁盘)硬盘相比,后者大多数扇区损坏都是由于机械故障,而不是扇区损坏。我很好奇这是为什么。
我正在寻找一种技术性但又以消费者为导向的解释,即发生故障的确切组件以及为什么频繁写入会影响该组件的质量,但要以不需要大量有关 SSD 的知识的方式进行解释。
答案1
NAND 闪存通过控制“浮栅”区域中的电子数量来存储信息。这些电子会改变存储单元的导电特性(打开和关闭存储单元所需的栅极电压),进而用于在存储单元中存储一个或多个数据位。这就是为什么浮栅保持电荷的能力对于存储单元可靠存储数据的能力至关重要。
写入和擦除过程会导致磨损
在正常使用过程中写入和擦除时,浮栅与基板之间的氧化层会退化,从而降低其长时间保持电荷的能力。每个固态存储设备在变得不可靠之前都能承受一定程度的退化,这意味着它可能仍能正常工作,但不能持续工作。NAND 设备在保持一致、可预测的输出的情况下可以承受的写入和擦除次数(P/E 周期)决定了其耐用性。
答案2
想象一下一张普通的纸和一支铅笔。现在您可以在纸上的一个位置随意书写和擦除任意多次。您需要多长时间才能写完整张纸?
SSD 和 USB 闪存盘具有这个基本概念,但是是在电子层面。
答案3
问题在于,所使用的 NAND 闪存基板在每次擦除时都会遭受性能下降。擦除这个过程涉及用相对的大量电能,这会导致芯片本身的半导体层略微退化。
从长远来看,这会造成损害,增加可以通过软件纠正的误码率,但最终闪存控制器中的纠错码例程无法跟上这些错误,并且闪存单元变得不可靠。
答案4
几乎所有消费级 SSD 都使用一种称为 NAND 闪存的内存技术。写入耐久性限制是由闪存的工作方式决定的。
简单来说,闪存通过将电子存储在绝缘层内来工作。读取闪存单元需要检查其电荷水平,因此要保留存储的数据,电子电荷必须长期保持稳定。为了提高存储密度并降低成本,大多数 SSD 使用的闪存不仅区分两种可能的电荷水平(每单元一位,SLC),还区分四种(每单元两位,MLC)、八种(每单元三位,TLC)甚至 16 种(每单元四位,TLC)。
写入闪存需要驱动升高的电压来使电子穿过绝缘体,这个过程会逐渐磨损绝缘体。随着绝缘层的磨损,单元保持电子电荷稳定的能力会下降,最终导致单元无法保留数据。对于 TLC 和特别是 QLC NAND,单元对这种电荷漂移特别敏感,因为需要区分更多级别以存储多位数据。
为了进一步提高存储密度并降低成本,制造闪存的工艺已大幅缩减,如今已缩小至 15nm 左右,而较小的单元磨损更快。对于平面 NAND 闪存(不是 3D NAND),这意味着虽然 SLC NAND 可以持续数万甚至数十万次写入周期,但 MLC NAND 通常只能持续约 3,000 次周期,而 TLC 只能持续 750 至 1,500 次周期。
3D NAND 将 NAND 单元一个接一个地堆叠在一起,无需将单元缩小到很小,即可实现更高的存储密度,从而实现更高的写入耐久性。虽然三星已将 3D NAND 重新转向 40nm 工艺,但美光等其他闪存制造商仍决定使用小工艺(尽管不如平面 NAND 那么小),以实现最大的存储密度和最低的成本。3D TLC NAND 的典型耐久性等级约为 2,000 到 3,000 次,但在企业级设备中可能更高。3D QLC NAND 的典型额定值为 1,000 次左右。
英特尔和美光共同开发了一种名为 3D XPoint 的新兴内存技术,它采用完全不同的数据存储方法,不受闪存耐久性限制。3D XPoint 的速度也比闪存快得多,快到足以取代 DRAM 作为系统内存。英特尔将以 Optane 品牌销售使用 3D XPoint 技术的设备,而美光将以 QuantX 品牌销售 3D XPoint 设备。采用该技术的消费级 SSD 可能最早于 2017 年上市,但我认为出于成本原因,3D NAND(主要是 TLC 类型)将成为未来几年大容量存储的主导形式。