假设:RAID 中有 2 个 HDD,3 年后丢失 1 个 HDD:
- 如果我们使用 RAID 0,我们会丢失数据
- 如果我们使用 RAID 1,我们在可能健康状况不佳的磁盘上也有一个副本,任何恢复都可能导致故障
- 如果我们使用 RAID 5,与 RAID 1 相同,但在重建期间我们可能会丢失另一个磁盘和所有数据
- 如果我们使用 RAID 10,与 RAID 1 相同,所有磁盘的工作时间几乎相同,并且磨损程度也几乎相同。
那么,如果我们可以简单地配置每晚备份,例如仅针对不同的数据,那么使用 RAID 有什么好处呢?在这种情况下,我们可能只会丢失一天的数据(如果合适,例如家庭文件服务器),但与主磁盘相比,备份磁盘的磨损程度会大大降低。
也许我错了您认为怎样?
答案1
RAID 不适用于备份-是为了可用性。如果 RAID 设置中丢失了磁盘,您的系统仍可运行。如果没有 RAID,您必须购买并准备新磁盘,然后恢复备份,然后您的业务才能继续。
答案2
Raid 5 与 Raid 1 不同,Raid 5 是使用分布式奇偶校验的条带化。对于 Raid 5,您至少需要 3 个磁盘。
不同类型的 RAID 不仅可以保护您的数据,还可以提供读/写性能。RAID 不是备份,而是在驱动器发生故障时的数据保护。
答案3
正如 Bert 所说,RAID 用于可用性和/或性能,而备份用于灾难恢复。备份(和快照)也有助于防止意外或错误造成的意外数据丢失,而 RAID 则不能。备份和 RAID 根本不是同一类。对于像 ZFS 这样的现代文件系统,这两个领域有些重叠,但备份仍然是必需的。
在设置服务器之前,我们应该评估数据保护的重要性、所需的性能以及潜在停机成本。这为我们规划 RAID 级别等提供了框架。
现在,RAID 1 及以上版本可以防止不必要的停机。正如 OP 所说,任何重建都存在发现另一个故障磁盘的风险。但是,随着 RAID 运行降级,我们有时间提前计划:制定计划 A 和计划 B,分配停机时间,准备替换部件,检查备份是否最新等等。也许我们可以在我们相同的培训服务器/器官捐赠者上测试运行该程序。你有一台,对吧?因为它很重要。
数据很重要,所以我们必须谨慎而精确地采取行动。RAID 为我们赢得了准备的时间。甚至可以直接购买一台新服务器并在下个周末进行迁移,而无需冒重建的风险。
就我的情况而言,大约 50 PB 的磁盘空间备份到集中式磁带系统,灾难恢复可能需要几天时间。针对 50M 文件的增量备份大约需要 12 小时。
在这种情况下,RAID 10 可防止停机以及上次备份和当前状态之间的数据丢失。但通常我会在磁盘达到临界年龄之前尝试更换服务器。
RAID 让我们能够专业地采取行动,而不是仓促做出反应。
答案4
最佳 RAID 配置可能实际上根本没有 RAID: https://blog.shi.com/hardware/best-raid-configuration-no-raid-configuration/
除此之外,至少在过去几年中,戴尔官方根本不推荐将 RAID 5 用于任何关键业务数据: https://eqlsupport.dell.com/WorkArea/DownloadAsset.aspx?id=6442454665 https://community.spiceworks.com/topic/251735-new-raid-level-recommendations-from-dell