每天接收数百 GB 数据的服务器上的阵列

每天接收数百 GB 数据的服务器上的阵列

希望这是一个简单的问题。现在我们正在部署将用作数据仓库的服务器。我知道对于 RAID 5,最佳做法是每个 RAID 5 使用 6 个磁盘。但是,我们的计划是使用 RAID 10(出于性能和安全性的考虑)。我们总共有 14 个磁盘(实际上是 16 个,但其中两个用于操作系统)。请记住,性能是一个很大的问题,哪个更好 - 做几个 RAID 1?做一个大型 RAID 10?一个大型 RAID 10 是我们最初的计划,但我想看看是否有人有我没有想到的意见。

请注意:该系统设计用于 RAID 1+0,因此丢失一半的原始存储容量不是问题。抱歉,我最初没有提到这一点。我们更关心的是,我们是否要使用一个包含所有 14 个磁盘的大型 RAID 1+0,还是使用几个较小的 RAID 1+0,然后使用 LVM 将它们条带化。我知道,更高 RAID 级别的最佳实践是阵列中永远不要使用超过 6 个磁盘。

答案1

看一眼这次讨论详细说明 HP ProLiant 服务器上 RAID 1+0 设置的磁盘布局:

6 盘 Raid 1+0

以 RAID 1+0 配置的智能阵列控制器是跨镜像对的条带。根据您如何安排驱动器笼以及您使用的控制器,磁盘可能会跨控制器通道配对。

例如在 4 磁盘设置中:

     Logical Drive: 1
     Size: 558.7 GB
     Fault Tolerance: RAID 1+0

     Logical Drive Label: AB3E858350123456789ABCDE6EEF
     Mirror Group 0:
        physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK)
        physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)
     Mirror Group 1:
        physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 300 GB, OK)
        physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 300 GB, OK)

物理驱动器 1I:1:1成对物理驱动器 1I:1:3
物理驱动器 1I:1:2成对物理驱动器 1I:1:4

有了这么多磁盘,将它们放在一个逻辑驱动器中没有任何坏处。您将获得更多的好处(最高年平均气温) 主轴,以应对连续工作负载和增加的随机工作负载能力。我建议调整控制器缓存以偏向写入(较低延迟),并可能在操作系统级别做出一些选择文件系统选择(XFS!)、输入/输出升降机(最后期限) 和块设备调整

这将在哪个操作系统发行版上运行?

答案2

马修 - 我是大的Splunk 客户端,我们专门使用 R10 - 无论是低端机箱的 SAS 磁盘、中型系统的企业级 SSD 还是最繁忙机器的 FusionIO 卡。您很聪明,并且为 R10 选择了合适的尺寸,相信您的直觉,您走在正确的道路上。

我们只为所有 /splunkdata 创建一个大的 PV/VG/LV,顺便将 /opt/splunk 留在启动磁盘上。

答案3

400GB/天相当于~270 MB/分钟。

RAID5 可能有效。就存储效率和写入性能而言,RAID 50 可能是最好的。RAID 10 将为您提供最佳写入性能,但代价是存储效率降低 50%。我担心大量写入加上随机读取……这会降低整体性能。

您使用的磁盘类型至关重要。如果可以使用 10k 或 15k 驱动器,性能将大大提高,但这些磁盘当然比企业级 SATA/SAS 7.2k 驱动器更昂贵,容量更小,目前最高可达 3+TB。

最终,没有人能告诉你什么最适合你的应用程序,所以你需要自己测试。我的建议是使用具有大写入缓存(512MB 或以上)和适当大小的读取缓存的 RAID 卡。然后,测试各种 RAID 组合(我建议 RAID5-6 和 RAID5-10,以及 RAID50 和 RAID10)。查看哪种组合性能最佳。调整 RAID 卡设置。您将找到最佳配置。

答案4

RAID-10 会将可用空间减半。我建议使用 RAID-50,它至少需要 6 个驱动器;它将提供出色的容错能力和性能。

您需要检查并测试多个 RAID 卡,因为它们的性能并不相同。如果您还不知道这一点,请确保使用企业级 SATA 驱动器,而不是台式机驱动器,也不是“绿色”驱动器。

相关内容