有没有关于具有相同/不同驱动器型号的 RAID 阵列的研究?

有没有关于具有相同/不同驱动器型号的 RAID 阵列的研究?

我们经常看到关于混合使用硬盘型号或品牌以用于 RAID 阵列的建议(也适用于任何磁盘组,例如 ZFS 池)。
理由是:同一批生产的驱动器往往具有相同的内在问题,因此往往会一起出现故障。

多年来,我在 60 多个系统上使用相同的驱动器进行 RAID。我从未发现任何问题。
但其他人注意到了。
观点、统计数据、巧合、运气、命运……还是真正的危险?

是否有关于 RAID 中的驱动器配对的(严肃的)研究或资料来源?

到目前为止,我知道的唯一一个好的理由是关于固件的:当一个驱动器由于固件错误而变砖时,孪生驱动器很可能会在很短的时间内出现故障。但另一批类似的驱动器也是如此。这是一种罕见的事件,但我们谈论的是两种方法之间的微小改进,因此罕见事件在平衡中是重要的。

答案1

我知道两篇有关硬盘和/或 RAID 的论文:

使用设备多样性保护数据免受批次相关磁盘故障的影响
这是基于批次故障,但没有讨论此类问题的频率。

现实世界中的磁盘故障:1,000,000 小时的 MTTF 对您意味着什么?
这是基于对 100,000 个磁盘的研究,其中对批次有一点涉及。

答案2

我从未见过专门针对 RAID 阵列的研究,但您所指的在科学界被称为“共模故障”,并且有很多这方面的研究。Google 是您的好朋友。

有趣的是,像您一样,多年来我在许多系统上构建了 RAID (5/6) 阵列,在我用相同驱动器构建的大约六个系统中,在发生驱动器故障的系统中,这些系统都在几个月内发生了多个驱动器故障。几年前,我有一个阵列,里面有 8 个相同的 9G 驱动器,其中 6 个在运行 3 年多后 6 个月内发生故障。这无疑坚定了我的信念观点某些驱动器制造商的故障。另一方面,没有发生故障的阵列仍然运行良好,其中一个阵列已经使用 10 年,其 (企业) 驱动器的保修期为 3 年。

但此处的常见模式故障仍然适用。我尝试在相同大小(企业)驱动器上混合搭配制造商,以完全避免此问题。(我也已切换到 ZFS 以绕过 RAID5 写入漏洞,但这是另一个话题)。

相关内容