印度尼西亚 Google Cloud 客户的灾难恢复中心

印度尼西亚 Google Cloud 客户的灾难恢复中心

我们订购了印度尼西亚的 Google Cloud 服务,根据监管要求,该服务在印度尼西亚设有本地服务器。该服务器既是我们的生产服务器,也用于存储数据。如果托管数据的服务器发生故障,我们将需要一个灾难恢复中心(备份服务器)进行切换。备份服务器将作为 Cloud 正常运行时间承诺的一部分进行维护,这种理解是否正确?

答案1

一个设计合理的业务连续性计划远不止向托管提供商请求一个实例那么简单。组织在恢复期间如何保持运行也是计划的一部分。即使您不再管理物理硬件,维护可用应用程序的重大责任也落在您身上。例如,您仍然需要进行备份和恢复。

想想你的所需的 RTO 和 RPO。在手动执行恢复时,您能承受 3 小时的意外停机吗?昨晚的备份是可接受的时间点吗,还是您必须从数据库中恢复每个事务?

查看可用的基础架构并了解其局限性。单个 Compute Engine 实例只能在一个区域(数据中​​心)中运行。虽然它可以在多个事件中保持运行,但区域中断(如火灾)会使其停止运行。您可以通过在多个区域运行托管实例组来缓解这种情况。甚至可以仅有一个实例的 MIG或者有时,您可以将一些细节外包给托管服务,例如如果您使用 Cloud SQL 作为关系数据库。

设计时要考虑局部限制。在世界各地启动资源非常容易。设置控制以限制仅在您所在地区。在某种程度上,如果整个地区瘫痪,可以限制您可以执行的灾难恢复计划。但是,由于有多个区域,因此一个地区是高度冗余的。只有发生重大事件才能阻止您启动实例和恢复备份。多区域配置有点复杂,一开始可能不是这样的设计。

测试!例如,删除服务器和磁盘。应该可以从备份中恢复它们。

相关内容