具有热备的 RAID 5 还是不具有热备的 RAID 10?

具有热备的 RAID 5 还是不具有热备的 RAID 10?

是的,这是那些“为我做我的工作”的问题之一,请怜悯一下:)

在不花大价钱的情况下,我可以用服务器中的硬盘数量做很多事情,但已经到了极限。我还剩下四个硬盘需要配置,我可以将它们设置为 RAID 5 并指定一个热备盘,也可以设置为 RAID 10 而不使用热备盘。每个硬盘的大小都相同,而且 RAID 5 的性能足够了。

我不推荐使用 RAID 5,但我也不喜欢在没有热备件的情况下运行。我不太在意性能下降,而是关心系统没有足够冗余的时间。服务器和驱动器处于 13x5 4 小时响应合同之下(尽管我碰巧知道最近的服务提供商在冬天至少要开车 2-3 小时才能到达)。

我应该指出,服务器还有两个 RAID 1 阵列,它们也受热备用保护。他们为什么不制造有 9 个托架的驱动器笼呢!呵呵。

答案1

阵列的停机容忍度是多少?它在物理上是近在咫尺,还是在远程数据中心?基本上,如果您可以容忍,冷备用允许您执行 RAID10。备用磁盘位于附近,但您必须物理地进行交换。如果这不是可接受的情况,那么带有热备用的 RAID5 是唯一的答案。

由于您已经拥有两组具有 1 个驱动器故障容错能力的 RAID1 组,因此使用没有热备用的 RAID10 对您来说实际上毫无益处。您的整个阵列仍然只能承受单个驱动器故障。

答案2

这些 raid 都是彼此相关的,假设阵列中具有相同的磁盘和控制器。

  • Raid5:读取速度好,写入速度差,如果故障发生的时间足够长,以便 raid 在两次故障之间重建,则可以承受任何双磁盘故障。(即磁盘故障、raid 重建、磁盘故障,您没事)。如果同时发生双磁盘故障,除非其中一个故障是热备盘,否则您就没救了。对于 4 磁盘阵列,一半的双磁盘故障会毁了您的一天。

  • Raid6:读取速度不错,写入速度很差。可以承受任何双磁盘故障。不像其他 raid 那样普遍实施。

  • Raid10:良好的读写速度,可以承受任何单个磁盘故障,可以承受(在 4 磁盘 raid 的情况下)一半的潜在双磁盘故障。

  • 三向镜像 + 热备件:空间少很多,可以承受任何双磁盘故障和最多 3 个磁盘故障(如果故障发生的时间足以让镜像重建一次)。我不确定有多少控制器/操作系统支持此功能,但这是我在 ZFS 之前的 Solaris 中与 MD 一起使用的功能。

当我们查看此信息时,有几个问题需要担心:

  1. 重建阵列需要多长时间?Sun 开始开发 ZFS 时,他们意识到在某些情况下,重建 raid5 阵列的时间比阵列中磁盘的 MTBF 还要长,几乎可以保证磁盘故障会导致阵列故障。

  2. 同一生产批次的磁盘可能都有相同的缺陷(托盘掉落或放入了太多在制作磁盘时在盘片上涂胶水

  3. RAID 阵列越复杂,控制器/实现上的软件就越复杂;我见过很多 RAID 控制器导致阵列损坏,就像很多磁盘故障导致阵列损坏一样。我见过单个磁盘旋转很多年——事实上,大多数磁盘都是这样。我曾经拥有的最可靠的系统是一个没有冗余的盒子,它从未发生过组件故障。我见过很多 UPS、RAID 和冗余(插入随机组件)导致故障,因为它们使系统变得足够复杂,而复杂性正是故障的根源。

你付出了钱,你就抓住了机会……问题是,

你觉得自己很幸运吗

答案3

我不得不反对 CHopper3。由于在这种情况下只有 4 个驱动器,因此无论哪种情况,您的故障能力都是相同的(2 个驱动器),但对于 raid 10,如果您恰好丢失了错误的 2 个驱动器,那么您将面临真正的问题。此外,为您的其他 RAID 配备全局备用驱动器肯定还有一个额外的好处。

答案4

还需要考虑其他一些事情……每个驱动器有多大/多快?1TB SATA 驱动器可能需要很长时间才能从 RAID5 中的热备用驱动器重建,从而为第二个驱动器故障留下很大的风险。

您说性能不是问题,但我看到 RAID5 重建期间(尤其是在写入时)发生了一些相当大的性能下降。

相关内容