我应该使用“Raid 5 +备用”还是“Raid 6”?

我应该使用“Raid 5 +备用”还是“Raid 6”?

什么是“Raid 5 + Spare”(摘自用户手册,第 4.17.2 节,第 54 页):

RAID5+Spare:RAID 5+Spare 是一种 RAID 5 阵列,其中一个磁盘用作备用磁盘,一旦磁盘发生故障,即可重建系统(图 79)。至少需要四个磁盘。如果一个物理磁盘发生故障,数据仍然可用,因为它是从奇偶校验块读取的。故障磁盘上的数据将重建到热备用磁盘上。更换故障磁盘后,替换磁盘将成为新的热备用磁盘。如果单个磁盘发生故障,则不会丢失数据,但如果在系统将数据重建到热备用磁盘之前第二个磁盘发生故障,则阵列中的所有数据都将丢失。


什么是“Raid 6”(摘自用户手册,第 4.17.2 节,第 54 页):

RAID6:在 RAID 6 中,数据被分条到所有磁盘(至少四个),每个数据块的两个奇偶校验块(图 80 中的 p 和 q)被写入同一个条带中。如果一个物理磁盘发生故障,故障磁盘上的数据可以重建到替换磁盘上。此 Raid 模式最多可支持两个磁盘故障而不会丢失数据。RAID 6 可更快地从故障磁盘重建数据。


“Raid 5 + spare”和“Raid 6”非常相似...我看不出区别。

什么时候“Raid 5 + Spare”效果最佳?

那么什么时候“Raid 6”会达到最佳效果呢?

手册用 5 星评级来简化不同的突袭。“突袭 5 + 备用”只得到 4 星,而“突袭 6”得到 5 星。如果我盲目相信手册,我会得出“突袭 6”总是更好的结论。是“突袭 6”总是更好的?

答案1

简而言之:

  • 如果您主要关心的是安全性,那么就选择 RAID6,因为它可以承受任何两个驱动器同时发生故障。如果在 R5+备件配置中一个驱动器发生故障,则在备件恢复速度之前,您无法避免再次发生故障,而这对于大型驱动器来说可能需要相当长的时间(并且,一个已经断电很长时间的驱动器,例如您的备件,在最终被调用时无法启动的情况并不罕见)。

  • 如果性能是王道,那么就选择 5+spare,因为当阵列未处于降级状态时,写入性能会更好 - 尽管 R5 和 R6 之间的性能差异明显小于 R5 与其他解决方案之间的差异如果您有一个好的控制器(即,一旦进行部分块写入操作“两/三个并发读取然后奇偶校验计算然后两/三个并发写入”大部分时间而不是“读取然后读取(-然后读取)-然后奇偶校验计算然后写入然后写入(-然后写入)”,这是一些非常便宜的控制器和软件 RAID 可能会做的事情。

编辑:我第一次错过了一个可能很重要的点:

  • 如果担心功耗,那么 R5+备件将具有额外的优势如果您的控制器会保持备用驱动器断电直到需要为止。

答案2

RAID 5 +热备盘:

  • 在同等控制器硬件上性能优于 RAID 6
  • 你不能同时丢失 2 个磁盘. 当你丢失磁盘时,有一个重建时间(使用热备用)您有无冗余任何在这段时间内失败的事情都会造成彻底的损失(除非把所有东西都送到好的数据救援公司并支付真正 $$$$)

RAID 6:

  • 性能比 RAID 5 差(取决于控制器,范围从非常明显到几乎没有区别)
  • 你可能会同时丢失 2 个磁盘

对于任何 RAID 5 或 6,您必须小心使用非同一生产批次的磁盘。这种情况可能发生(我见过!),即在重建时发生一次故障后,由于压力增加,下一个磁盘也会发生故障。来自同一批次的磁盘具有完全相同的固件,并且可能非常相似的物理特性。

编辑:选择什么

(这也取决于服务器的性能要求和可以承受的风险。)

如果服务器的硬件环境非常好(colo,气候等),那么使用 RAID5 + 热备用就足够了。

如果环境导致短时间内多个磁盘发生故障的可能性较大(振动、湿度、污垢),则选择 RAID 6。

始终有足够的备份并测试恢复。

编辑2:不错的 RAID 控制器擦洗,定期验证所有部门。

答案3

RAID5 使用一个奇偶校验条带。需要计算 Reed Solomon 错误校正并为 RAID6 写入两个条带,而 RAID5 只需写入一个条带。RAID5 用于密集型数据库应用程序,因为 RAID10 的成本很高,因此存储量巨大。RAID5 成本从 67% 到 94% 不等,而 RAID10 的磁盘可用性为 50%(存储成本高得多)虽然由于旋转延迟,RAID6 的读取延迟降低了很小的量,但由于计算错误校正和额外写入奇偶校验位,RAID6 的写入速度要慢 25% 到 31%。

使用驱动器的平均故障间隔时间 (MTBF),两个驱动器相继或同时发生故障的概率约为(0.1% x 0.1%)*120.001 x 0.001 * 12;如果您有 1000 个驱动器在运行,则平均每年将损失约 1.2 个驱动器。大约每 8.3 年就会有两个驱动器相继发生故障。现在,由于重建期间驱动器负载过重,驱动器故障不是泊松分布,因此在此期间第二个驱动器发生故障的可能性更大,并且分布更接近伽马分布,故障发生后的值略高。

最重要的是,RAID5 在写入和数据库应用程序方面的性能优于 RAID6 - 好得多。对于主要读取的应用程序(例如 Web 服务器),这没什么区别,您应该使用 RAID6。对于大型存储,使用 RAID5 比 RAID10 具有巨大的成本效益。如果您能负担得起开销,请将 RAID10 用于高度磁盘密集型应用程序。RAID10 的性能始终会更好。

最大的误解是 RAID 不是备份,而是一种通过提供冗余来限制停机时间的方法。如果数据至关重要,您应该备份它(并测试您的恢复过程)。

如果一个由 10 个 2TB SAS 硬盘组成的 RAID 阵列出现故障,恢复将花费数千美元,并且需要数周时间(即使可以完成)。

所有 RAID 阵列最终都会失败!

答案4

您考虑过 10 个吗?如果您有足够的磁盘用于 raid 6,那么您就有足够的磁盘来做 10 个卷。在大多数情况下,10 个更快,冗余度更高(以牺牲一些磁盘空间为代价)。

相关内容