SSD Raid1 同时发生故障的担忧

SSD Raid1 同时发生故障的担忧

由于 SSD 具有需要磨损均衡的写入限制,因此人们会认为,如果所有条件相同,则 2 个相同的 SSD 驱动器镜像数据写入,它们的磨损程度将几乎相同。当一个驱动器发生故障时,您可以假设另一个驱动器通过材料和逻辑上的微小差异来保持正常。由于写入均衡不会通过逻辑结构限制位的物理位置,因此我认为解决此问题的方法是使用大小相似但不完全相同的驱动器。例如,我会将 240gb 驱动器与 256gb 驱动器镜像。即使从逻辑上讲我没有使用 16GB 的物理空间,但通过写入均衡,驱动器不会允许忽略该区域。还是我混淆了写入均衡的机制?

或者应该完全避免使用 Raid1,而选择具有热插拔功能的 Raid5 或 Raid6?由于没有写入相同的数据,因此各个驱动器的磨损均衡应该有所不同。在这种情况下,单个驱动器的故障并不表示其他驱动器也会立即发生故障。即使如此,Raid6 在丢失 2 个驱动器时的容错能力应该可以缓解这些担忧。虽然在换入新驱动器时需要重新计算奇偶校验,这会带来很大的处理量,但 SSD 的 IO 速度会减少旋转介质所需的总重建时间。此外,根据突袭计算器,如果我使用 Raid10 或 Raid6,那么 4 个 256Gb 驱动器的结果是一样的。如果我有资金,我会购买 8 个驱动器和 2 个 raid 卡并测试两者,看看故障是如何发生的,但我完全没有资金进行这项研究。

我应该选择哪种方式,Raid10 还是 Raid6?是否有大量关于镜像相同 SSD 同时发生故障的文档?如果是这样,使用 Raid6 在每个设备上写入不同的数据是否可以防止这种情况发生,还是数据量而不是数据形状决定了驱动器磨损?大小不匹配是否可以提供一些保护,因为磨损均衡将使用所有可用的物理硬件,而不是逻辑结构所规定的硬件?并且由于 SSD 的快速 IO,在替换驱动器上重建数据时,Raid6 是否变得更有吸引力?

答案1

实际上,SSD 的 MTBF 和写入周期容差估计不是终止开关。如果 SSD 的额定写入次数为十亿次,它不会在写入次数为十亿次和一次时死亡。结合磨损均衡算法、TRIM 或其他片上垃圾收集等技术,以及两个 SSD 因写入磨损而相隔数分钟甚至数天死亡,这将是稀有的

无论如何,您都应该监控硬件以防发生先发制人的故障,因此即使两个磁盘同时出现故障,您也可以在发生诸如写入磨损之类的灾难性故障之前更换它们。

相关内容