显然,关于数据归档有很多问题,但我想就给定场景中如何选择合适的方法征求您的意见:
- 公司拥有一个大约 1.5 TB 大小的关键任务数据“档案”,并且该档案还在不断增长(数据越大,增长速度也越大),存储在 RAID6 阵列中(由于控制器故障,该阵列已经失败过一次,RAID 并不是解决所有问题的答案,对吧...)
- 他们需要备份该档案,最好是异地备份,因为他们真的承受不起丢失它
- 由于带宽较窄(上行链路约 512Kpbs),云等是不可能的
- 仅限基于 Linux 的服务器
所以我的问题是:您会选择基于磁带还是硬盘的归档解决方案?磁盘更便宜,但处理起来似乎更麻烦,我习惯认为,一旦您存储了磁带,您就可以非常确定您会恢复数据。至少比硬盘好,即使它断开连接并存储在某个储物柜中。
数据集的保留率不是很高,一年前就足够了,只要我们每月创建一个快照(不确定是否每次都重新存档,还是使用增量)。
编辑:
为了澄清我所谈论的数据类型:
- 他们(该公司)是一家拥有自己的 DTP 部门的出版社
- 没有关于长期数据存储的立法相关问题,没有要遵守的标准等等
- 他们存储大型图像,并准备好用于生产打印的 PDF 和 InDesign(或其他)文件
- 恢复时间并不是一个关键问题。如果发生全面灾难,等待数小时/数天的恢复时间不会有问题,因为相关存储通常不用作日常使用的工作环境
- 他们尝试了蓝光,但自从数据量超过一定程度后,就不再可行了(整个档案的两个备份集仅在媒体成本上就价值约 1000 美元)
- 每年的数据增长量在 0.5 到 1TB 之间,这显然取决于他们所做的工作
答案1
我认为这个问题的答案取决于公司存档的数据类型,以及他们必须保留什么数据以及在哪里保留数据是否存在法律问题。例如,如果有立法规定他们必须以安全的格式保存 x 年的数据,等等。
老实说,如果数据小于 4TB 左右,而且不是 PCI DSS 数据或其他数据,我会考虑使用几个小型 NAS 盒,在需要备份的那天将它们带入大楼,然后将它们存储在两个不同的地方。
例如,我刚刚构建了一个 12TB 的 RAID 盒,花费不到 1500 美元。
或者:您可以花大约 180 美元购买 3TB 的 Western Digital Reds。您可以将它们放入 USB 外壳中,然后这样做!购买 12 个这样的磁盘(每月一个)。只是一个(可能疯狂的)想法。
编辑:这还取决于您希望如何以及何时恢复数据。如果您需要从磁带中为某人恢复单个文件,这比插入 USB 驱动器要麻烦得多……