采用 SAN 的无共享数据库系统

采用 SAN 的无共享数据库系统

云数据仓库最近非常流行,我想知道它们的架构方式是否存在内在矛盾:

Terradata、Greenplum 等需要“无共享”架构才能表现良好(根据供应商文档),但云的本质是大多数东西都是共享的。

当您在您喜欢的任何供应商的云中启动虚拟机时,您总是会使用共享存储(这是虚拟化的本质)。

这肯定会引发存储阵列和/或 SAN 争用的可能性吗?有人能帮我理解一下吗:

  • 任何供应商如何能够可靠地确保存储吞吐量(这对 DW 性能至关重要)而不会造成配置瓶颈?
  • 当每个云供应商都使用虚拟化并因此使用共享存储时,为什么我们仍在谈论“无共享”?

答案1

任何供应商如何能够可靠地确保存储吞吐量(这对 DW 性能至关重要)而不会造成配置瓶颈?

通过雇用真正聪明的人来设计他们的后端系统。

当每个云供应商都使用虚拟化并因此使用共享存储时,为什么我们仍在谈论“无共享”?

什么都没分享。引用 Inigo Montoya 的话:

在此处输入图片描述

当应用于分布式系统时,无共享通常并不意味着它们对底层硬件具有独占访问权。相反,无共享是指分布式系统的成员不需要访问相同的共享资源……例如共享存储。

举一个具体的例子,最近,在 VMware vCenter 集群中,需要使用共享存储卷才能使用实时迁移“VMotion”技术。每个 ESXi 成员主机都可以访问相同的后端存储,虚拟机数据实际上存储在该存储中。这是不是一个无共享系统,因为主机必须共享某物. 在这种情况下存储。

快进到当前的 vCenter/ESXi 版本。现在,成员 ESXi 主机不再需要访问相同的共享存储卷。它们可以直接在主机之间迁移虚拟机,包括将虚拟机支持数据(vmdk/vmx 文件等)从一个主机传输到另一个主机。是一个无共享系统。

回到你关于云供应商、共享资源和性能保证的问题:仅仅因为资源是共享的并不意味着不能实施控制以确保一定的性能水平。例如,在 AWS 中,可以根据应用程序所需的特定 IOP 来配置 EBS 卷。当执行此操作时,AWS 将保证始终满足你指定的 IOP 设置。我在 AWS 中广泛使用这种类型的配置,并且可以保证它们确实如此非常能够很好地满足客户所需的 IOP 设置。

VMware(我猜 Hyper-V 也有)具有类似的技术,可以限制和优先安排虚拟机的存储、网络和 CPU 使用率,以便它们以可预测的方式运行并且不会相互产生不利影响。

相关内容