我的组织最近购买了一个存储系统。它有 1.5PB 容量,配有 RAID6,并且在不同的物理位置有一个在线同步镜像。
系统允许回滚/文件恢复,默认允许最多 30 天,但可以增加。
我们正在讨论是否需要对仅存在于存储中的数据进行某种额外的备份。
该系统具有非常好的冗余度,它具有地理冗余度并且允许一定程度的回滚,这意味着我们可以恢复定义时间内(默认为 30 天)的旧数据或意外删除的数据。
在这种情况下,进行“传统”备份是否仍然有意义?我所说的传统备份是指专用的备份系统,其中包含快照,以便在出现问题时可以检索。
我们真的需要它吗?我是否忽略了什么?我是否只是按照传统方式思考并且过于热心?
答案1
你所描述的本质上是一个地理分布的 RAID 和一个 RAID从来都不是备份。
在线同步通常意味着您在主存储上执行的所有操作都会立即复制到备份系统,包括攻击者删除(所有)快照和/或卷等操作,或者仅仅是管理员错误。
答案2
30 天回滚是一项很棒的功能,但如果“至关重要的文件 xyz”损坏/损坏,而直到 31 天后才检测到,该怎么办?这种情况是备份和归档计划之间的区别,但您的描述中没有提到后者。归档系统通常存储在非常低成本的磁带上。此外,没有关于该企业是否有监管或其他要求将数据保留超过 30 天的信息,这种情况经常发生。
如果你的情况不是这样,那你应该没事。
答案3
让位于地理上分离的两台机器都拥有数据是件好事。
如果您的两个或所有站点都发生多起故障,会发生什么情况?一个站点发生火灾,另一个站点的服务器被盗?或者它们之间的线路出现问题,然后主站点的服务器出故障,HD 控制器失控并写入垃圾?或者一些内部人员对两个站点都进行恶意操作?或者 FBI 因怀疑而没收了您在两个站点的服务器(您永远不会这样做,但也许您与笨蛋共同托管在数据中心)。或者……这让我想起了几次备受瞩目的“云”中断,其中一切都是冗余的,经过了深入分析,但事情仍然可能出错。我承认这些都不太可能发生,但您已经承认不太可能发生的事情是可能发生的。
所以,关键在于这些数据有多重要/有价值?如果这些数据最终丢失了,组织该怎么办?
答案4
假设:存储系统将被许多应用程序使用。
我认为,有了单独的备份系统,效果会更好。
RAID 和镜像不是备份,但内置的回滚功能可以替代传统的备份系统。
但:
我更喜欢基于应用程序/数据而不是基于存储的恢复策略,因为:
- 应用程序对数据恢复和可接受的丢失有不同的要求(其中一些要求由不同的法规规定:只读介质、加密、保留最近 X 年的数据等),
- 一些应用程序具有(非常)好的内置备份和恢复工具(oracle,mssql),并且推荐使用这种方式来执行备份/恢复部分(作为 Oracle DBA,我更喜欢并且我将使用 rman 进行所有与 Oracle 相关的备份)。
- 增长,你的空间使用量增长速度可能比你预期的要快得多,现在这个系统可以容纳 30 天的回滚数据,但未来并不能保证
- 更便宜,经过几年的增长,使用更大容量的磁带来适应备份/恢复策略的成本将小于购买新的、更大的磁盘的成本,以便遵守与现在相同的回滚窗口