继最近在法国 OVHCloud 斯特拉斯堡数据中心发生的事件后,我们不禁想知道,如果我们目前在 GCP 上托管的 DC 遭遇类似的命运,我们在云端的整个堆栈会发生什么。
一切都通过 3-4 个不同的虚拟机上的 k8s 运行。
一个区域内的多个 DC 之间是否存在数据碎片,从而可以防止数据完全丢失?他们的 DC 是否有某种最后的手段,例如,如果开始发生任何危险事件,就开始将所有内容迁移到另一个 DC 中?
这里的根本问题是:我们是否需要在至少两个地区正确复制我们的服务,以确保这种情况永远不会发生在我们身上?
答案1
Google 拥有不同类型的存储以及不同级别的存储。
如果您的数据位于本地磁盘上(https://cloud.google.com/local-ssd),你就会迷失。
对于永久性磁盘,则视情况而定。区域永久性磁盘除外(https://cloud.google.com/compute/docs/disks/high-availability-regional-persistent-disk),(根据 SLA)所有 PD 仅位于一个区域的一个可用区中。
您可以在以下位置找到所有当前选项的概述https://cloud.google.com/compute/docs/disks
您可以跨多个区域存储快照:https://cloud.google.com/compute/docs/disks/snapshots
创建 K8S 集群时,可以将其配置为区域性的。在这种情况下,默认情况下,该集群在一个区域的 3 个区域中运行:https://cloud.google.com/kubernetes-engine/docs/concepts/region-clusters
最后声明:OVH 发生的事情不太可能发生在 Google 或 AWS 上(我猜也不太可能发生在 Azure 上)。但其他事情可能会发生,而且已经发生了。因此,无论如何,如果可用性和灾难发生时的恢复时间是您的目标之一,您应该将数据存储在至少两个独立云的至少两个区域中并运行应用程序。