raid 10 中 8 个 SSD 同时发生故障

raid 10 中 8 个 SSD 同时发生故障

我的朋友一直在和我争论是把 SSD 放在 RAID 中还是 HDD 放在 RAID 中,我需要解决这个问题。假设它们来自同一条装配线并且制造时间匹配,所有 SSD 同时发生故障的概率与 HDD 相比是多少?

在这里工作时,我们看到软件 raid 的 SMART 状态全部为 4x 错误。这可能是控制器或管理 raid 的内核的问题。还是硬件本身的问题?

答案1

RAID10 中相同 SSD 发生故障的几率比人们想象的要高,因为您实际上依靠制造过程中的微小差异来提供稳健性,而且当 SSD 驱动器发生故障时,它们往往会发生灾难性的故障。

最好在阵列的每个部分使用不同的驱动器,这样它们来自不同的工厂并具有不同的故障特征 - 但这实际上只不过是常识。

根据他的证据要求,对另一张不正确的海报做了一些引用 -

我的“批量标准”消费级三星 840 EVO SSD 上支持 RAID(当然,链接显示这并不罕见这里(三星)和这里*对于 OCD) 并查看我的 (Intel) SSD SMART 请求的转储作为开始) -

smartctl -i /dev/sda smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-35-generic] (本地构建) 版权所有 (C) 2002-13,Bruce Allen、Christian Franke、www.smartmontools.org

=== 信息部分开始 === 设备型号:Samsung SSD 840 EVO 500GB mSATA 序列号:S1KMNEAF100764Y LU WWN 设备 ID:5 002538 844584d30 固件版本:EXT41B6Q 用户容量:
500,107,862,016 字节 [500 GB] 扇区大小:512 字节逻辑/物理 旋转速率:固态设备 设备为:
不在 smartctl 数据库中 [有关详细信息,请使用:-P showall] ATA 版本为:ACS-2、ATA8-ACS T13/1699-D 修订版 4c SATA 版本为:SATA 3.1、6.0 Gb/s(当前:6.0 Gb/s) 本地时间为:2014 年 12 月 27 日星期六 20:34:11 NZDT SMART 支持为:可用 - 设备具有SMART 功能。SMART 支持:已启用

软件 TRIM RAID 支持 - 查看这里这里

SSD 容易在读/写周期结束之前发生故障,并且通常会造成灾难性的后果(即驱动器停止工作,而不是由于过多的写入而变成只读状态。)

答案2

无论您使用的是高端控制器还是内核 RAID,大多数 SSD 都不支持 RAID 中的 TRIM。然后,SSD 的存储分配量不到总容量的 80%,因此驱动器的固件能够通过用新的(未分配的)部分替换频繁使用的部分来重新调整分配的数据区域。如果您使用日志文件系统,那么内核(软件)RAID 的 RAID 和日志之间的透明度会变得更加复杂,如果您使用控制器,那么在 SSD 内部计算使用模式的时间和方式可能会排除其中一些,至少是部分排除 - 前提是所有 SSD、控制器和操作系统都完全相互支持。

我只是在猜测,但我会支持你的论点,反对你朋友关于 RAID 上 SSD 与 HDD 的立场。我也更喜欢 RAID 1 及以上级别的 HDD 以实现数据冗余,以及单驱动器配置或最多 RAID 0 的 SSD,其中性能是主要目标。特别是在使用 RAID 10 时 - 无论您使用什么,性能都会受到影响,但 HDD 将是更好的选择。SSD 在交换或分页方面表现得非常出色,只要您分配的不超过其总存储容量的 50%。当最终 SSD [编辑:磨损,而不是故障 - 故障意味着缺陷,磨损意味着达到可预测的服务结束] 由于非常频繁的交换,您只会丢失一些交换或 Windows 页面文件 - 更换驱动器并继续!

顺便说一句,SMART 是 HDD,而不是 SSD 技术,如果您的内核 RAID 或控制器能够将其报告给您的操作系统,那就太好了 - 但 SMART 与 HDD 的健康状况有关,而与操作系统或您的 RAID 配置或控制器本身无关。

我对“8x 同时故障”驱动器一无所知,但答案肯定是这样的。

相关内容