我正在设置一个包含 44 个 4TB 7200 RPM SAS HD 的 JBOD。我选择 RAID 60,因为我更喜欢驱动器故障保护,而不是 RAID 10 提供的性能改进。我的问题是如何选择每个跨度的最佳磁盘,从而实现合理的重建时间。例如,假设我留下 4 个热备用磁盘,这将导致以下可能的 RAID 设置有 40 个磁盘:
- 2 个跨度,20 个磁盘,可用容量约为 144 TB。
- 4 个跨度,10 个磁盘,可用容量约为 128 TB。
- 5 个跨度,8 个磁盘,可用容量约为 120 TB。
- 8 个跨度,5 个磁盘,可用容量约为 96 TB。
我倾向于使用 4 个 10 个磁盘的跨度,因为它似乎提供了容错能力(每个跨度容忍 10 个驱动器中有 2 个故障)和可用容量(80%,低于 2 个 20 个磁盘的跨度的 90%)的最佳平衡。
但是,对于单个 10 个磁盘跨度,我预计重建时间是多少?网络搜索显示,即使是 10 个磁盘跨度也可能不可行,因为重建可能需要太长时间,因此重建期间可能会出现额外的驱动器故障。但是,互联网上的许多资源都基于较少的磁盘或较低容量的磁盘。
对于如此大量的磁盘,您认为最佳设置是什么?
注意:有大约 10 TB 数据的备份策略,但备份所有数据并不可行。因此我倾向于 RAID 60 而不是 RAID10。我意识到这不能替代备份,但更好的驱动器故障恢复确实使系统更加强大,因为它提供了在发生多个磁盘故障时重建然后将数据迁移到其他存储的机会。
编辑:规格:
- 磁盘:Seagate 4TB SAS 3.5 英寸 HDD 7200 RPM,企业级。
- 控制器:ServerRAID M5016 控制器,包括启用 RAID6 的控制器、LSI2208 芯片组。请参阅:https://www.broadcom.com/products/storage/raid-on-chip/sas-2208。
- 外壳:Supermicro 4U 存储 JBOD 45x3.5,配备 2x1400W 冗余电源模块。
- 操作系统:CentOS Linux 版本 7.1.1503(核心)。
感谢您的帮助。
答案1
使用 Avago (LSI) 或 Microsemi (Adaptec) 的现代硬件 RAID 控制器,20+2 个磁盘 RAID 阵列完全没问题。重建时间合理(少于 24 小时)。无论如何,当前驱动器的故障率非常低。我肯定会使用 2 个跨度。
答案2
对于 4 TB 7.2k 驱动器,我建议将子阵列做得尽可能小 - 实际上,5 个驱动器根本没有理由使用 RAID 6。
我的 2c 是使用 RAID 10,您可以预期重建在 12 小时内完成,而 5 驱动器 20 TB RAID 6 阵列很可能不会完成。
确保启用每月数据清理/媒体巡查/无论它叫什么,以在读取错误有机会阻止重建之前检测它们。重建失败时,通常不是驱动器完全故障,而是一个相当老但未被发现的读取错误,可以通过定期清理来修复。
答案3
根据收到的出色评论,我尝试使用由 5 个跨度(每个跨度 8 个磁盘)组成的 RAID60,原因如下:
根据最近包含 2 个 20 个磁盘的重建,我估计 8+2 配置的重建时间是合理的。
与磁盘数量较多的跨度(例如,每个跨度 10 或 20 个磁盘)相比,可用容量略有减少。虽然 20TB 的损失似乎很大,但跨度较小意味着可以实现重建,这是可以接受的权衡。
我将使用我收集到的任何其他信息来更新这个答案。
编辑:删除了 RAID5 作为可行选项。
答案4
在这么大的阵列上,我会真的使用 RAID10 或等效的 ZFS 镜像设置。您可以设置 42 个磁盘的 RAID10 + 2 个全局热备盘(可用空间约为 82 TB),它将提供出色的磁盘故障保护和重建时间非常快。
如果您真的非常想使用 RAID6,我倾向于使用 5x 10 磁盘跨度。