什么算作‘大型’ raid 5 阵列?

什么算作‘大型’ raid 5 阵列?

我办公室里的 Buffalo TeraStation NAS 最近出现了一个问题,促使我对 Raid 5 进行调查。

我发现了几篇文章讨论了在大型阵列或大型磁盘中使用 raid 5 的不适宜性

这是一个示例文章讨论了使用大型消费驱动器重建阵列的问题。

我想弄清楚什么才算“大”?

我们这里的 NAS 是 4 驱动器 Raid 5 设置,每个驱动器为 1 TB。一个驱动器发生故障并已被更换,阵列目前正在重建。

这种设置是否规模很大,在重建期间是否可能出现问题?

这种设置对于日常使用来说有多可靠?

答案1

设计磁盘阵列的可靠性:

  1. 找到您驱动器的 URE 率(制造商不喜欢谈论他们的驱动器故障,因此您可能需要深入挖掘才能找到它。它应该是 1/10^X,其中 X 通常在 12-18 左右)。
  2. 确定您的存储需求可接受的风险率†。通常,失败概率小于 0.5%,但在“临时”存储中可能为几个百分点,对于关键数据,该概率可能小于 0.1。
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    对于具有多个奇偶校验磁盘的阵列或具有多对镜像磁盘的镜像,请将1阵列中的驱动器后面的更改为具有奇偶校验/镜像的磁盘的数量。

所以我有一组四个 1TB WD Green 硬盘组成一个阵列。它们的 URE 率为 1/10^14。我将它们用作临时存储。1 - (1 - 1TB x 1/10^14byte) ^ 3=>3.3%一个硬盘坏掉后重建阵列存在失败风险。它们非常适合存储我的垃圾数据,但我不会将关键数据放在上面。

†确定可接受的故障是一个漫长而复杂的过程。它可以总结为Budget = Risk * Cost。因此,如果故障的成本为 100 美元,并且发生的可能性为 10%,那么您应该预算为 10 美元来预防。这大大简化了确定风险、各种故障的成本以及潜在预防技术的性质的任务 - 但您明白了。 [Data Drives] = [Total Drives] - [Parity Drives]。双磁盘镜像 (RAID1) 和 RAID5 有 1 个奇偶校验驱动器。三磁盘镜像 (RAID1) 和 RAID6 有 2 个奇偶校验驱动器。使用 RAID1 和/或自定义方案可以拥有更多奇偶校验驱动器,但这并不常见。


然而,这个统计方程也有一些注意事项:

  • 该 URE 率是广告宣传的比率,并且通常在大多数下线的驱动器中都更好。您可能会很幸运并购买比广告宣传好几个数量级的驱动器。同样,您可能会买到一个因过早损坏而报废的驱动器。
  • 一些生产线存在运行不良的情况(运行中的许多磁盘同时出现故障),因此从不同制造批次中获取磁盘有助于分散同时出现故障的可能性。
  • 旧磁盘更容易在重建的压力下损坏。
  • 环境因素造成影响:
    • 经常进行热循环的磁盘更容易损坏(例如,经常打开/关闭电源)。
    • 振动会引起各种问题 - 请参阅 YouTube 上的视频IT 人员对磁盘阵列大喊大叫
  • “谎言有三种:谎言、弥天大谎和统计数据”——本杰明·迪斯雷利

答案2

这篇文章存在的原因是为了引起人们对硬盘驱动器上不可恢复的位错误率的关注。具体来说,就是廉价的“家用 PC”磁盘。它们的出厂规格通常为 1 / 10^14。这大约是 12.5TB 的数据,如果您使用 2TB 磁盘进行 RAID-5... 您很快就会达到这个数据。

这意味着您应该:

  • 使用较小的 RAID 组,并接受更高的浪费空间。
  • 使用 RAID-6 并接受额外的写入惩罚。(比 RAID5 高 50%)
  • 购买更昂贵的磁盘 - “服务器级”的 UBER 规格为 1 / 10^16,这意味着这是一个没有实际意义的观点。(1.2PB 优于 12.5TB)

我通常建议 RAID-6 通常是可行的,但它会降低性能。

相关内容