如何为 124 TB Isilon 文件系统实现廉价的灾难恢复?

如何为 124 TB Isilon 文件系统实现廉价的灾难恢复?

在我们的 Isilon 集群上,我们有一个 124 TB 的文件系统。目前已占用 38%,包含 3100 万个文件。大约一半的数据是图像文件,平均文件大小为 1.5 MB。我们使用快照来防止意外删除,但我们需要一些不同的东西来防止完全故障(例如,系统管理员错误、软件错误或水、热或火损坏)。而且因为我们是一个简陋的研究实验室,所以它不应该太昂贵。

我们目前尝试备份到磁带,但这有两个问题。首先,仅遍历目录树并声明每个文件就需要五天以上的时间,因此即使是增量备份也需要一周以上的时间。其次,也是最重要的,恢复需要数周甚至数月的时间。

理想情况下,我们希望在灾难发生后一周内再次访问大部分数据。(如果我们可以选择首先恢复哪些目录,那么在几周内逐渐恢复数据是可以的,但采购新的存储设备和恢复可能需要更长的时间。)我能想到的唯一在一周内恢复的方法是在单独的位置维护磁盘上的副本。至少丢失几天的工作是可以的,因此复制可能会稍微滞后或在几天内覆盖文件系统。复制的性能比原始性能差很多也是可以的。

Isilon 的解决方案是使用 SyncIQ 将文件系统复制到另一个集群。由于这是在块级别运行的,因此它避免了遍历文件系统和统计每个文件的问题。可以预料的是,成本有点高:SyncIQ 软件的许可证是 55,000 美元,然后是昂贵的 Isilon 存储同步的成本(尽管使用他们更便宜的 NL 存储会有所帮助)。我预计 Isilon 解决方案的成本将在每 TB 500 到 1000 美元之间,这比我们为主要存储支付的 1300-1900 美元/TB 要好得多,但对我们来说仍然是一大笔钱。

鉴于如今原始硬盘的价格为 60 美元/TB,我希望能够以远低于 Isilon 的价格拼凑出 124 TB 的慢速存储,并且有一种方法可以在不到一周的时间内复制更改。你能想到办法吗?

答案1

我也在一家运行 Isilon 集群的商店工作;我并没有真正接触过太多,所以我不能说太多关于任何具体的细节。

但是按照我们的设置方式,我们确实可以备份到磁带;我们有一个磁带机器人,所以我们不必一直切换磁带盒(我想这会让长时间备份变得更容易忍受)。我们还选择了更昂贵的 X 系列 Isilon 节点,并且刚刚获得了一堆;是的,每个节点的存储空间更少,但也允许对故障有更多的容忍度。

相关内容