想要了解 RAID 5 2 驱动器故障的实际经验吗?

想要了解 RAID 5 2 驱动器故障的实际经验吗?

我想知道是否有人有大型驱动器 RAID 5 2 驱动器故障的亲身经历?

据我了解,理论上,对于 1-2TB 的大容量硬盘,如果 RAID 组中一个硬盘发生故障,则需要重建所有内容,因此会严重影响所有其他硬盘,并且再次发生故障的可能性也会增加,尤其是如果硬盘来自同一制造批次。如果您丢失另一个硬盘,则会丢失所有数据。

这通常在“RAID 不是备份”这句话之后得到解释,我同意这一点。

这个理论很有道理,我也理解,但它真的会发生吗?

答案1

是的,我遇到过这种情况。一组 4 个(消费级)WD 500 硬盘在大约一周内出现故障。我更换第一个硬盘时动作很慢,没有将阵列脱机,结果在第二个硬盘出现故障时丢失了所有数据。我重新使用了剩下的两个好硬盘,其中一个在下个月出现故障。它们都得到了适当的冷却和保养。我只能说,我现在相信了“坏批次”的说法。

在另一起事件中,我遇到了 3 个不同品牌和型号的硬盘在一个月内相继出现故障,不过我很确定它们故障的原因是通风不当。不要损坏您的硬盘!

答案2

这确实发生在我身上,但这并不是驱动器发生故障的最常见方式。我在 raid 5 中有 4 个 500gb 外部 sata 驱动器。它们连接到一台便宜的旧 IBM 机架式服务器。整个装置藏在楼梯下,有一天,可能是老鼠或兔子,但有东西咬断了一些电源线,导致 2 个驱动器短路。所有驱动器都装在便宜的外部机箱中,所以我想我不应该这么惊讶。

答案3

你是在问你是否能连续丢失 2 个驱动器吗?当然,任何事情都可能发生。Raid 5 可以大大提高数据访问的可用性和性能,但 raid 5 不会备份任何东西。它只是帮助防止由于单个驱动器硬件丢失而导致数据被使用。它不是数据的副本。你无法恢复旧副本、旧修订版或当前工作的副本。此外,它无法防止数据损坏。除了丢失驱动器之外,还有更多可能出错的事情。病毒可能会破坏你所有的数据,小妹妹喜欢看着你桌面上的垃圾箱在她将文件扔进去时变满和变空,愚蠢的朋友将一瓶苏打水洒在你的机器上,等等。

另外,请记住,您可能会丢失硬盘 RAID 控制器。而且您不能将阵列移到另一个随机控制器上。您通常必须使用完全相同的控制器,但仍然可能会出错。一些 RAID 控制器将信息存储在板上,而其他控制器将配置信息发送到连接的阵列。当这种情况出现时,这是一种赌博。

在 SF 也有同样的问题: https://serverfault.com/questions/2888/why-is-raid-not-a-backup

需要更多理由吗?

编辑:你的想法是正确的,任何人都有可能遇到这种情况。我个人没有见过多个驱动器发生故障,但我见过一些驱动器在非常接近的时间点发生故障。它们都没有处于重建窗口期,但从技术上讲这是一种风险。但是,如果真的发生什么事情,你有一个备份,对吧?哈哈。有些人有时会从这个方面吸取教训。Raid 6 通过双奇偶校验将其提升到一个新的水平,最多可以丢失 2 个驱动器。对于任何 raid 设置,故障的概率都会随着阵列的大小(驱动器数量)和复杂性而增加。驱动器越多 = 可能出现故障的点越多

答案4

个人的我没有经历过,但我听过那些经历过这种事情的人的尖叫声。任何存储系统——无论是单个驱动器、USB 密钥、磁带、大型 RAID 安装还是 Amazon S3——最终都会以对您最不方便的方式发生故障。重建 RAID 5 组时发生第二次故障只是这种情况可能发生的方式之一。

另外,对三重奇偶校验 RAID 的支持集成到 OpenSolaris 中几天前——因此至少有一家供应商认为,在奇偶校验 RAID 重建期间允许两次额外故障是值得的工程努力。

相关内容