我处理大型基因组测序数据集(1TB-2TB)。最近我们在戴尔工作站上丢失了一些重要数据。我们计划每天定期存储和备份数据。我听说过 RAID,但不确定哪种 RAID 系统(0、1、5、10..)最适合我们的目的。
答案1
如果你计划使用 2 个以上的硬盘RAID 5最适合您的目的。使用n硬盘 RAID 5 提供容量n-1驱动器使用,同时允许一磁盘发生故障。
例如,如果您使用 5 个容量为 2 TB 的硬盘,那么您可以有效地使用总共 2*(5-1) = 8 TB,同时提供对单个故障磁盘的容忍度。
与此相反,你也可以使用RAID 1或者RAID 10/0+1这基本上意味着你正在镜像你的数据。使用n = 2磁盘,您可以有效利用一个磁盘的存储空间,使用另一个磁盘进行镜像(这实际上是 RAID 1)。使用n≥4(和n甚至)你可以将镜像与条带化结合起来,以有效地利用n/2用于存储的磁盘。
这取决于具体情况RAID 5 或复合 RAID 10/0+1 是否更合适。
注意:无论您使用哪种 RAID 类型,请务必备份您的数据!RAID 永远不会取代备份!
试想一下,如果某个文件从您的 RAID 系统中被意外删除/覆盖,那么该文件将永远丢失,因为它也会在镜像/复制磁盘上被删除/覆盖。
答案2
看起来您需要 RAID 1:数据以相同的方式写入两个驱动器。
如果您存储的数据集非常大(您将它们存储在多个磁盘上),您可以考虑使用 RAID 5(数据使用特殊的校验和复制到不同的磁盘上,如果其中一个磁盘发生故障,您可以恢复所有数据)
来源:http://en.wikipedia.org/wiki/RAID#Standard_levels
注意:Raid 0 可以提高性能,但不能提高数据安全性,当您使用多个磁盘(至少 4 个)时,Raid 10 是很好的选择
答案3
我会说 RAID5 按照大小、成本、速度、数据可用性(冗余)使用类型等等...
重复:RAID 不是备份;请始终至少保留 1 个已验证的备份。
操作系统阵列:操作系统倾向于使用非奇偶校验 RAID(0、1、10),以便 CONSTANT winRegistry 和虚拟内存/分页文件的写入奇偶校验计算开销不会使系统陷入困境(就像在 RAID5、6、50、60 中对于任何写入或降级阵列读取一样)。
RAID0 阵列:
RAID 是冗余阵列等;因此 RAID 0 有点自相矛盾,因为它是独立磁盘的非冗余冗余阵列;它是唯一不能提供更高数据可用性的 RAID 级别(仅增加了速度和空间)。
非操作系统阵列:对于非操作系统阵列(应用程序、数据、数据库),我们可以进行比写入更多的读取(因此除非阵列性能下降/缺少硬盘,否则不会计算奇偶校验)。因此,情况会有所改变。此外,某些数据库专门设置为从 0、5、6、10、50、60 的条带读取,将读取条带(不是 RAID1 或 01)。如果为数据库提供其自己的软件缓存,最好通过 RAID 控制器关闭硬件 RAID 缓存。
阵列成本:从空间角度而言,RAID 5 可能是最便宜的冗余阵列(RAID0 更便宜,但不冗余)。
阵列维护:备份,已验证。每月更新重置为原始冗余/镜像/奇偶校验,以在 HD 脱机之前梳理出任何坏块。在单容错阵列方案中,当 HD 发生故障/脱机时,希望阵列的其余部分保持原始状态。设置为更窄容差的 RAID 控制器可能是更好的控制器,要求更高;但似乎发生更多故障或只是 HD 脱机。
阵列条带中的硬盘数量:条带越宽(硬盘越多),条带读取速度越快,RAID5 中硬盘8(第 9 个驱动器)的速度会变慢,因为奇偶校验计算的开销变得非常巨大;假设这种模式在双奇偶校验 RAID6 类型中更早出现。阵列条带中的硬盘越多,1 脱机并必须重建回阵列序列的可能性就越大。但同样:阵列中的硬盘越多,当硬盘发生故障并出现坏块时,坏块不会出现在发生故障的硬盘上的可能性就越大,从而击穿单容错阵列。
阵列中的双冗余:RAID6 在大型阵列上可能更流行,或者更为关键;但速度不是双故障容错。重建时,在更大的阵列重建中,容错阵列上发生双故障的可能性更大(增加风险/暴露)。更大的多层阵列(10、50、60 等)可以具有更高的容错能力,以应对日常运行风险以及重建故障。
维护 X 阵列中的 HD 数量:HD 越多,1 离线的几率就越大 X 阵列穿孔的几率就越大 = 处理更大阵列时的风险/谨慎程度越大。
答案4
您应该选择 RAID1 或 RAID5。选择一方面取决于您的预算,另一方面取决于您数据所需的空间。:
- 使用 raid1,您可以实现出色的容错能力,但可用空间将与只有一个磁盘时相同。Raid5 的容错能力较低(只有一个驱动器),但空间效率更高,因此可用空间将取决于驱动器数量(如果您有 3 个以上的磁盘,它会比 raid1 更好)。
- 性能方面,raid1 在读取方面略胜一筹,而 raid5 在写入方面则好得多。
- 您可以至少使用 2 个磁盘来构建 raid1,而对于 raid5,您至少需要 3 个磁盘(但您需要更小的磁盘才能获得与 raid1 相同的空间)。
正如演讲者所说,
RAID 永远不会取代备份!