如何正确地对文件服务器进行灾难恢复?

如何正确地对文件服务器进行灾难恢复?

我们目前正在为 Windows 文件服务器实施 DR 策略。我们已排除存储复制,因为它是一项预览功能,并且故障转移群集是为高可用性而非 DR 而设计的。DFSR 在复制打开/锁定的文件方面也存在缺陷,因此不适合执行此任务。

在我看来,文件服务器虚拟机的 SAN 到 SAN 复制似乎是最佳方法,尽管有人警告我不要这样做,因为复制是原始副本,未在更高级别合并,可能会导致文件系统不一致或文件损坏。但是,对于使用此方法复制的任何服务器,这一事实都是正确的,并且这是我们 DR 计划中用于其他服务器的方法。VSS/以前的版本也始终可用于恢复任何损坏的文件。

执行 SAN 复制的好处是否大于文件损坏的风险?或者是否有更好的方法对文件服务器进行 DR?也许有一种产品可以执行更高级别的复制/快照,从而最大限度地减少数据中的逻辑不一致?

注意:集群正在运行 vSphere 5.5

答案1

SAN 到 SAN 复制是让文件服务器在宣布灾难后尽快恢复在线状态并尽量减少损失的最佳选择。请注意,这种类型的 DR 保护无法保护与本地备份相同的内容 - 例如,您不能使用复制的 SAN 卷来恢复上个月删除的文件。

损坏的文件不会对 SAN 到 SAN 复制造成危险,除非是主站点上的文件服务器损坏了它们。每个提供基于块的存储 (LUN) 复制的 SAN 都具有某种机制来防止损坏并保证一致性。这是一个比大多数人想象的更棘手的问题,因为出于优化原因,即使没有复制,写入也经常以无序方式应用于磁盘。这就是为什么大多数存储的写入缓存都具有某种电源故障安全网(如电池或 UPS):如果写入不仅保存在缓存中,则底层磁盘可能会损坏。通常这是可以的,但是如果断电,您需要确保存储确认的最后一个写入已保存到磁盘,以便在启动时使磁盘保持一致。

复制会根据您复制的方式以不同的方式处理此问题:

  • 同步复制保证一致性,因为它不会向本地服务器返回写入确认,直到确认写入已安全到达辅助站点。这会大大减慢写入速度,并且没有供应商支持在距离相对较短的恒星连接上执行此操作。事实上,支持的距离通常很短,以至于您容易受到相同飓风的影响。这种情况很少见,通常不是唯一存在的东西。
  • 异步检查点复制是迄今为止最常见的算法,绝大多数开放系统存储都使用这种算法。该盒子会定期复制一个一致的检查点,这意味着它将确保在远程系统上找到的可恢复副本没有丢失的写入。如果它在检查点中间被中断,它会丢弃它并转到最后一个已知的一致点。我见过这样的系统,只要你的广域网支持它,就可以用这种方法让你在 15 秒内恢复点。
  • 异步按顺序传递复制与检查点相比,这种方法更为罕见且更难实现,但在我看来,它是同类异步算法中最好的。它的作用是按完成的顺序通过 WAN 发送写入。问题是,与检查点复制不同,如果这落后了,则用于保存未发送写入的存储无法刷新,除非完全重新同步(重新发送所有数据)。通常,如果链接无法跟上写入,它将退回到检查点模式,并在获得足够新的检查点后再次开始按顺序交付。EMC 的恢复点和日立的 HUR 都这样做,但我还没有看到任何其他供应商以这种方式设置。

所有这些机制都为您提供了“崩溃一致性”。磁盘处于与您突然关闭服务器电源时相同的状态。从崩溃一致性副本运行文件系统和数据库需要一点工作量,但这始终是可行的。如果您想要更多的东西(您在问题中提到的“更高级别”),您需要将复制与应用程序集成。这通常意味着暂停应用程序上的写入,等到所有内容都已转储到存储中,然后启动复制的一致性点。这称为“应用程序一致性”。它通常会提供稍旧的恢复点,但恢复时间比崩溃一致性略短。

答案2

您需要为多种级别和类型的灾难做好准备,包括完全恶意入侵(黑客)和所有硬件完全丢失(极端天气)。这将要求您将一些数据卸载到 sneaker-net 分发方法(阅读,外部存储,如磁带/硬盘)、某种形式的一次性写入解决方案或在线备份服务(昂贵)。

灾难恢复与简单的复制不同。在做出任何决定之前,您需要确定这一点:“我可能会丢失多少数据?“不要以 GB 为单位思考,而要以时间。我可以丢失 4 小时的数据吗?我可以丢失一天的数据吗?您选择的方法将取决于您对这个问题的回答。我们都希望有一个零损失的解决方案,但对于正在减轻的风险来说,这通常不是一项可行的投资。您还需要保留每月/每年备份的副本一段时间,因为您还可能会发生灾难(用户删除他们需要的垃圾),而您在很长一段时间内都不知道。

答案3

SAN 到 SAN 复制是恢复站点灾难的最快方法,但由于固件错误,我在 IT 生涯中曾经历过 SAN 损坏,情况可能会变得很糟糕

您忘记写下您使用的虚拟机管理程序。但是如果您使用 ESX,我建议使用 SAN 复制 vReplicator 产品。默认情况下,它每 15 分钟复制一次,并且您的远程 VM 处于准备启动状态。vReplicator 需要 vCenter 许可证和物理主机来保存复制的 VM。(成本可能低于另一个 SAN,但正如 @IceMage 所说,这取决于您可以浪费多少时间)

答案4

我建议使用 Veeam 来对文件服务器虚拟机进行低 RPO 复制。它支持 VSS,可用于本地复制以及复制到 WAN 和云目标,并具有多个保留点。

设置滚动的 15 分钟快照,按小时或按天发送异地。成本相当高,非常实惠。

如果您有一个远程虚拟机管理程序,则可以配置部分运行手册,以启动具有适当网络和 IP 设置的复制虚拟机。

相关内容