具有 vMotion 和 HA 的两台服务器 ESXi 4.0 群集的 SAN 选择

具有 vMotion 和 HA 的两台服务器 ESXi 4.0 群集的 SAN 选择

我计划将两个独立的 vmware ESXi 4.0 主机移入群集,以使用 ESXi (essentials plus) 的 vMotion 和 HA 功能。目前,我们有一个开发 vm 主机和一个生产 vm 主机,并且希望能够在生产 vm 发生故障时将开发 vm 主机用作 HA 主机。我们的商店几乎只使用戴尔服务器。

我正在考虑使用配备 9.6 TB 10K 驱动器的 Equal logic PS4000x SAN 或 PowerValut MD3000i 或 MD3200i 系列。我有几个问题。对于 vmware 主机和添加存储而言,哪个是更好的解决方案?我从戴尔那里得到了不同的反馈,我们需要的不仅仅是 SAN 和 ESXi 主机之间的交换机,以便我们使用 vMotion 和 HA 功能。这是真的吗?

哪种 SAN 选项能让我们在未来最轻松地扩展数据存储和 SAN 存储?我们目前有一个文件服务器,提供 2 TB 的数据,并且数据量不断增长,我们希望将其转换为 P2V。戴尔解决方案是不是一个糟糕的选择?

我们应该选择 NetApp 硬件吗?我们的预算相当灵活,不算疯狂,但未来能够轻松且经济高效地添加存储的能力很重要。

答案1

我最近实施了一个 EqualLogic PS4000XV,通过 2 个 Powerconnect 6224 交换机连接到一对运行 SD 卡的 R710 ESXi 主机。

在 HA、vMotion 等方面表现非常出色。您可以相当轻松地在 SAN 和主机之间使 MPIO 工作(仅需一点 esxi 远程 cli 操作)。

到目前为止,我见过的 PS4000XV 的唯一缺点是存储处理器设置 - 设备中有一对 SP,但一次只有一个处于活动状态。另一个处于离线状态,端口处于离线状态。因此,由于您通过最多 2 或 3 个接口进行通信,因此您会损失一些可能的性能。如果您将故障转移到另一个 SP,则在协商其端口并启动时会出现时间滞后。我假设更高规格的 PS 设备没有这个限制,并且可以提供主动/主动 SP 配置。

Dell 对 SAN 的建议是将其配置为单个 RAID 50 阵列,这样最终可获得 6.2Tb 的可用空间。

此型号的扩展选项基本上是“购买另一台设备”。但是,您只需将其插入相同的存储结构(交换机),就可以通过单个“组”IP 和控制台进行管理……因此管理开销不大。

关于 VMWare 中的 HA - 当您启用 HA 时,它只会发生在单个 VM 上...您不会将两个 VM 绑定在一起。VM 会同时在 2 个主机上同步启动,并且内存会在主机之间同步,这样如果一个主机发生故障,另一个主机会立即弥补不足。因此该方法不适合“使用开发 VM 作为具有 HA 的 DR”。

如果您计划将开发虚拟机用作生产虚拟机的 DR 故障转移,请仔细考虑其实际用途。您的 DR 配置需要能够以尽可能少的时间延迟启动为生产服务(这是 DR 的全部意义所在),那么开发机在任何一个时间点距离生产有多近?

编辑 要在 ESX 上启用 vMotion,您必须确保主机服务器上运行的 CPU 几乎相同。如果您运行不兼容的 CPU,则无法在主机之间进行 vMotion/集群/HA。VMWare 和供应商提供了兼容性矩阵来验证这一点:

答案2

就比较这两个 SAN 而言,它们都针对类似规模的环境,但您应该记住它们之间存在差异,我将在下面讨论其中一些差异。对于您的环境,两者都可以毫无问题地完成您想要的工作,并且可以毫无困难地扩展到支持 3-4 个主机和 10-15 个左右的平均 VM。如果您选择 MD3xxx 型号,您可能不需要为 SAN 配备任何交换机,但我不推荐这样做。

您所说的需求中没有令人信服的理由要求使用 NAS 功能而不是 iSCSI SAN。入门级 NetApp NAS 总体上并不比这些戴尔入门级 SAN 更合适,但它们是非常强大的共享存储解决方案,可以满足您的需求,并且根据具体情况(例如,如果您需要单实例存储支持),可能更适合。

支持 VMware 群集服务
这两个阵列都支持所有需要“共享存储”的 VMware 群集功能 - (vMotion、HA、容错、DRS\DPM)。从存储角度来看,您需要的是所有 VMware 主机都具有与 SAN 的 [冗余] 连接,并且这两个阵列都可以提供这种连接,而不会出现任何问题。根据型号和您要执行的操作,您可能不需要为 SAN 配备任何交换机,但您可能需要。

注意:除了 iSCSI SAN 连接之外,VMware HA\FT\vMotion\DRS 等都需要单独的集群网络接口。理想情况下,这些接口应该是弹性的(每个功能有两个或更多接口连接到单独的物理交换机) - 这些要求与您的 SAN 基础架构完全无关 - 应该尽可能与其他一切分开。

PS4000 与 vSphere 的 vStorage API 的本机集成比 MD3000i 或 MD3200i 好得多。这意味着您将能够将快照、克隆等任务卸载到阵列硬件上,而不是依赖软件来实现这些存储功能。

SAN 交换机。

对于单阵列环境,您不需要任何带有 MD3000i\MD3200i 的交换机。您可以直接将它们连接到两个独立的主机服务器,每个 SAN 控制器上都有一个 iSCSI GigE 端口,但这样一来,所有连接就用尽了,而且在将来添加更多服务器时,扩展性/可扩展性为零。我只见过一次这样做,但如果您可以忍受这些限制,它就会工作得很好,而且它确实消除了一层复杂性和可能的​​故障。

如果您拥有多个服务器,则无法使用 Equallogic 阵列安全地执行此操作 - 您的服务器必须能够看到所有 EQL 接口(主动和被动),以确保架构安全运行。

如果你选择合适的基于交换机的 SAN,你不需要拥有两个交换机,但我不会使用在网络结构级别没有冗余的 SAN。当你必须移动某些东西或在交换机上执行固件更新时会发生什么?如果我不能自信地走到其中一个交换机前并将其关闭,我会将 SAN 视为一种负担。

一般而言,您不应在同一台交换机上混合 iSCSI SAN 流量和普通流量。如果您别无选择,请确保使用 VLAN 在第 2 层将其分开。如果您未能做到这一点,性能将受到严重影响,并且可能会出现一些严重的安全问题,对您造成严重影响。

避免使用廉价的开关,无论如何都要避免使用真正廉价的开关。

平等逻辑

优点
Equallogic 架构专为横向扩展而设计 - EQL SAN 的容量和性能会随着阵列的增加而增加。PS4000 是有限的入门级型号,当您只有 PS4000 时,只能扩展到两个阵列,但如果您购买任何 PS6000,则可以混合搭配,然后纵向扩展,就像所有阵列都是 PS6000 一样。从 Windows 的性能角度来看,这种横向扩展效果非常好,在 vSphere 4 上也相当不错,而且 4.1 版的性能越来越好。

Equallogic 架构的设置、管理和监控非常简单。增加容量非常简单 [“只需插入另一个阵列”],并且由于架构的工作方式,性能可以同时扩展。SAN HQ 监控控制台非常有用、免费且易于安装。

根据我的经验,主动\被动控制器解决方案效果很好 - 请记住,每个控制器最多管理 16 个磁盘,并且可以轻松应对使这些磁盘饱和所需的 IOP 级别(2000+)。PS4000 面临的最大性能挑战是其 iSCSI 端口数量有限(2),这使得单个阵列的吞吐量低于 200Megabytes/sec。但是,添加另一个阵列,该数字就会翻倍 - 添加 PS6000,您将获得三倍的总带宽。在测试条件下,我已经将混合的 10K SAS 7.2K SATA 4 节点 PS6000 组推至超过 7000IOPs 和 1.6Gbytes/sec,在现实世界中,您的里程可能会有所不同,但它们肯定会扩展。

Equallogic 阵列能够很好地处理磁盘故障,其保守默认设置的好处之一是,您需要发生大量故障或快速连续发生多个故障才能引发问题。顺便说一句,我从未见过 Equallogic 阵列在生产中发生故障 - 而在测试中,通常需要拔出 4 个或更多磁盘才能强制阵列脱机。

缺点
Equallogic 架构尚未得到很好的理解 - 设计中存在一些不灵活性,如果不提前考虑这些因素,可能会出现问题 - 每个阵列只能限制一种磁盘类型和 raid 类型,而多阵列设置中阵列之间需要大量带宽是另一个限制。

Equallogic 解决方案占用大量磁盘容量。所有 SAN 解决方案在某种程度上都是如此,但 EQL 默认值和快照和复制的推荐保留可能会让您有点吃惊:以 9.6TB PS4000 为例 - 估计这是以这个容量报价给您的,但它配备了 16x600GB 驱动器,您不会使用任何原始容量 9.6TB。首先,在 EQL 环境中,您可以从每个 600GB 磁盘获得大约 520GB 的可用存储空间,然后使用 Equallogic 的默认热备用策略(RAID10 或 RAID50 为 2)并选择 RAID-50(用于奇偶校验的另外两个磁盘空间),这相当于 6.2TB 的基本用户容量。如果您想有效地使用其(非常强大的)硬件快照,您需要将计划提供给服务器的容量限制为大约一半 - 因此可用容量下降到 3.1TB。如果您选择在此阵列上实现最佳性能并选择 RAID-10,则基本可用容量为 3.6TB,如果您计划大量使用快照,则可用容量为 1.8TB。在较大的环境中,当您在阵列之间使用硬件复制时,情况会变得更糟 - 您的可用容量可能会从最初的 9.6TB 容量降至 1.2TB。

每个阵列只能使用一种 RAID 类型和磁盘大小,如果只有一个阵列,则无法将逻辑卷彼此隔离。即使您有多个阵列,也很难做好。因此,将存储呈现给数据库服务器,您可能希望将 DB、tempdb 和日志卷 IO 彼此隔离,这是不可能的。使用 EQL,您必须信任阵列为您管理 IO 隔离。

您只能购买安装了 8 个或 16 个磁盘的阵列,我认为戴尔正在停止 8 个磁盘选项。如果您现在想购买 5 个磁盘,以后再添加几个,那您就没那么幸运了。

在多阵列环境中,如果丢失一个阵列,则该阵列所属池中的所有卷都将脱机,除非您做出了一些非常具体的[性能限制]设计选择。

仅当一个组中有大约 4 个或更多阵列时,EQL 设计的真正优势才会发挥作用。

MD3000i\MD3200i

优点
这些是更传统的单片存储阵列。从概念上讲,它们非常简单,工作方式与大多数硬件 RAID 控制器一样,只是规模扩大了 - 购买所需数量和大小\速度的磁盘;将磁盘划分为 RAID 组,然后从中划分逻辑磁盘。随着规模的增长添加更多磁盘,并通过添加 MD1000\MD1200 磁盘柜进行扩展是一个简单的过程。

如果您愿意,您可以选择如何在单个阵列中混合搭配 RAID 类型。在配备齐全的 15 驱动器 MD3000i 上,您可以拥有 5 驱动器 RAID 5 包 600GB 磁盘、单独的 3 驱动器 RAID 5 包 600GB 磁盘和 6 驱动器 RAID 10 包 15k 磁盘,用于一些专用的高性能卷。这比 EQL 方法更难管理,但它允许您做出使用 EQL 无法做出的特定设计选择。如果您的工作规模需要总共不到 30 个磁盘,那么 MD3000i 会更加灵活。

MD32000i 的控制器带宽是 MD3000i 的两倍 - 除非 MD3000i 非常便宜,否则我不会仅仅因为这个原因而选择它而不是 MD3200i。

如果您主要关注的是容量而不是性能,那么添加相对大量的廉价(从 SAN 角度来看)存储是可行的。我已经安装了几个相当大的 MD3000i 用于存档类型存储 - 带有 RAID 6 和 2TB 驱动器的单个 MD3000i 可提供约 72TB 的可用存储空间。有了这么多 SATA 磁盘,对于存档\备份到磁盘类型的用途来说完全没问题,但您不会想将其用作大量虚拟机的主存储。

缺点
MD3000i 现在已经过时了,噪音很大,耗电量很大。MD3200i 在这方面要好得多,因此几乎可以肯定,使用寿命期间的运行成本更低。

管理功能有点基础 - 自动警报不是由阵列处理,而是由您必须在某处运行的管理应用程序处理。性能监控不如 EQL 的 SANHQ 提供的那么灵巧。

当您扩展超过单个阵列时,MD3000i\MD3200i 扩展是通过 SAS 连接的 MD1000\MD1200 磁盘托盘进行的 - 当您开始超过 30 个磁盘甚至更早时,从性能角度来看,这种方法扩展性不佳。

使用 MD3000i\MD3200i 阵列来扩展性能要困难得多 - 如果您发现需要向现有卷提供(比如说)1000 个 IOP,您将不得不购买大量额外的磁盘、移动大量内容、构建新的 RAID 包、提供新的卷、迁移数据,并希望在遇到 SAS 总线限制之前到达您想要的位置。使用 Equallogic,您只需将一个阵列添加到包含相关卷的池中,它几乎会自动提供该阵列。

答案3

MD3000i 是较旧的 3Gbps 总线。如果您要进行新投资,我至少建议您使用 3200 系列以获得 6Gbps。

如果您的预算较多,我会选择 EMC。否则,戴尔、IBM 和 HP 设备完全可以接受。EqualLogic 制造了一些非常好的产品,而且价格适中。

如果您想要最前沿的技术,请考虑 10Gbps。

除了交换机之外还有什么?我想象不出是什么,除非我们谈论光纤通道,那么除了光纤通道交换机之外,它只是一个主机总线适配器。

答案4

我有这两种解决方案:MD3000i、LeftHand。

您只需要在 MD3000i 和 ESXi 服务器之间安装一个千兆交换机。我认为更好的长期解决方案是 LeftHand,因为它可以同步或异步复制到另一个 LeftHand。虽然您现在可能不需要这个,但一两年后您可能想要它。我觉得 LH 在配置 LUNS 方面更灵活一些。

这两个设备都具有出色的性能,并且易于通过 ESXi 集群启动和运行。这两种解决方案都是不错的选择。

MD3000i 具有内置硬件冗余功能:电源、RAID 控制器等。LH 解决方案通过两个非冗余系统相互镜像来实现冗余。

HA 和 VMotion 在两个系统上运行良好。

相关内容