24TB RAID 6 配置

24TB RAID 6 配置

我负责一个新网站,它属于一个细分行业,存储了大量数据(每个客户 10+ TB,很快会增长到 2 或 3 个客户)。我们正在考虑订购价值约 5000 美元的 3TB 硬盘(10 个采用 RAID 6 配置,10 个用于备份),这将为我们提供大约 24TB 的生产存储空间。数据将写入一次,并在网站的整个生命周期内保持不变,因此我们只需要备份一次。

我了解基本的 RAID 理论,但我对此并不熟悉。我的问题是,这听起来像是一个好的配置吗?这种设置可能会导致哪些潜在问题?

另外,进行一次性备份的最佳方法是什么?有两个 RAID 6 阵列,一个用于异地备份,一个用于生产?还是我应该将 RAID 6 生产阵列备份到 JBOD?

编辑:数据服务器正在运行 Windows 2008 Server x64。

编辑 2:为了减少重建时间,您认为使用两个 RAID 5 而不是一个 RAID 6 怎么样?

答案1

我目前支持 220 台服务器,最高容量可达 96 TB(总计约 2 PB),其中一些服务器的集群容量高达 240 TB,这些服务器都是我的团队构建的。以下是我的建议:

  • 使用优质、可靠的硬件 RAID 控制器:可能的选择有 3Ware 96xx 或 97xx、LSI 92xx、Areca 16xx、Adaptec 5xx5...当然,还需要配备电池备用装置,因为有时会发生电源故障。
  • 仅使用专业级驱动器,提供 24/24 和 7/7 运行支持;不要使用廉价的台式机硬盘。您不会希望因为选择为每个驱动器节省 20 美元而丢失价值 100,000 美元的数据。
  • 驱动器越大,重建时间越长。3 TB 最好的情况下至少需要 12 小时。使用 RAID-6 可获得可靠保护。
  • 驱动器确实会出故障。每年高达 5%;千万别想着使用 JBOD,即使用于备份。这绝对是个坏建议。使用 RAID-6。
  • RAID-5 已经过时了,我们不再将它用于 300GB 以上的驱动器。请参阅此例如专家帖子。我有没有提过您应该使用 RAID-6?
  • 对于仅 24 TB,我会坚持使用 2 TB 硬盘;3 TB 的溢价为 10-15%;更多的主轴将提供更好的性能、更短的重建时间和更好的安全性,因为这些硬盘已经上市很长时间了,而且非常可靠。
  • 您可以购买一款出色的 3U Supermicro、AIC 或同等机箱,它具有 16 个驱动器插槽,装有 2TB 驱动器(RAID-6 + 热备用),可提供正好 24 TiB 的可用空间和冗余电源。

答案2

老实说,我认为 5000 美元的硬盘有点贵……但这是另一个话题。这个设置听起来不错,但如果硬盘发生故障……重建一个 24TB 的单卷将需要很长时间。(有没有试过读取分散在其他 9 个磁盘上的 3TB 数据?)最好使用较小的 raid 集并将它们连接在一起以形成更大的卷。如果一个硬盘发生故障,它不会在重建整个卷时破坏整个卷的性能……而只会破坏一个 raid 集的性能。

此外,根据您的网站运行的环境...(Linux/Windows/OSX/Solaris/???)也可以决定您使用的工具和使用的配置。

您所说的“一次性备份”是什么意思?如果您指的是“单向存档”……(即新文件被写入备份服务器……但不会从中读取任何内容),我强烈建议在 *nix 风格的环境(linux/unix/etc……)中使用 rsync,或者如果它是基于 IIS(windows)的,则使用类似 synctoy 或 xxcopy 之类的东西。如果您需要 LIVE 副本(文件写入到其他服务器时没有延迟),则需要提供有关您的环境的更多信息。Linux 和 Windows 的工作方式完全不同,工具也完全不同。对于这样的内容,您可能需要研究集群文件系统,并且可能应该更多地考虑 SAN 而不是基于主机的存储。

答案3

我们通常使用 RAID5 或 6 作为备份磁盘,因为一旦忽略 RAID 0,它就能带来最佳性价比 :-) 因此我会选择它而不是 JBOD

您可能需要考虑的一件事是分批购买磁盘,而不是一次购买全部 20 个,因为如果某一批次存在制造缺陷,它们可能会在相似的时间出现故障。

如果数据仅被写入一次,您可能还希望考虑使用镜像而不是传统备份 - 有相当多的软件和硬件存储系统允许进行设置,并且您还可以在主存储发生故障时获得故障转移的好处。

答案4

在确定 SAN 的 RAID 配置时,您必须考虑性能、可靠性以及所需的恢复时间。由于您将奇偶校验写入次数加倍(取决于 RAID Six 的具体类型),因此最好在具有自定义 ASIC 的 SAN 中进行计算。由于您的数据是静态的,因此您真正关心的是,如果 1 个驱动器发生故障,您能承受降级状态多长时间。还要注意的是,驱动器往往会多次发生故障,因此最好在两组之间留出一些时间安装驱动器。

就备份而言,我认为备份集中不需要冗余,因此 JBOD 就足够了

相关内容