SAN 系统升级/设计

SAN 系统升级/设计

大家好,我是长期潜水员,第一次发帖。为了简洁起见,我先提出我的问题,然后再给出更长的背景故事,这样你就可以选择想读多少。

简洁版本...

我们需要 SAN 升级,当然还需要额外的容量,并且很可能需要更好的性能。我们的主要工作负载是大约 20 个不同的虚拟机和几个 SQL 数据库。除了几个域控制器、交换和各种标准企业服务之外,主要工作负载是通过 citrix 托管应用程序,每天大约有 300 名用户访问该应用程序。目前,我们有一个 HP MSA1500cs SAN 控制器,带有 2 个 MSA30 机箱,几乎完全填充了大约 3.7 TB 的原始驱动器空间。纯容量并不是真正的大问题,性能和可靠性才是。我认为在可预见的未来,我们的容量需求不会超过 10 TB。问题是,我们是否应该在现有控制器上添加一个或两个机箱?我们是否应该升级到当前一代 MSA 产品 MSA2000 系列?我们是否应该升级到 EVA4400 系列?我们是否应该考虑最近获得的左侧 SAN 解决方案?如果我们最终要做的不仅仅是为当前控制器增加空间,我们应该坚持使用光纤通道还是考虑 iSCSI?预算并没有真正确定,因为这是一个更大项目的一部分,需要很大的预算,但我想说我们希望预算低于 5 万美元,而且越便宜越好。

长版本...

我们即将扩展我们的服务器场提供的服务。如果你想了解详情,我们是一家拥有大约 45 家养老院的养老院公司。我们将实施完全电子图表,这意味着我们对数据库和 Citrix 的使用将大幅增加。目前,每个机构每天可能有大约 2 名护士与我们的医疗记录软件进行交互。这将改变为每个机构大约有 6 名护士使用该软件的频率远高于目前的使用频率。

除了医疗记录系统外,我们还为大约 600 名用户提供 Active Directory 和 Exchange、工资单系统以及各种常见的杂项服务。医疗记录系统的当前数据库 (MS SQL 2005) 约为 30 GB,随着新的使用模式,它将有所增长,但大多数情况下,访问频率将比原始大小增加更多。

在详细介绍硬件之前,我想说的是,我们是 HP 公司,而我的老板,IS 总监,对于选择其他供应商非常固执。你我可能不同意选择 HP,但这是板上钉钉的事。

我们正在将服务器群从 16 台配备较旧 Xeon CPU 的 HP BL20p 刀片(双插槽机器,但目前大多数只有一个 CPU)升级到现代标准下内存不多的服务器(最多支持 8 GB,大多数都远低于此),例如 HP DL580 G5,它有 4 个插槽,每个插槽都配备 4/6 核现代 Xeon 或 Opteron 和 128 GB 内存。我们目前正在使用 VMWare ESX 3,并计划升级到最新版本的 VMWare。我也希望对服务器发表评论,但我的主要问题是关于我们的 SAN,请继续阅读。

我的任务是研究如何升级我们当前的 SAN 解决方案。我们目前有一个 HP MSA1500cs 控制器和 2 个完全填充的驱动器机箱,大约有 3.7TB 的原始驱动器空间。这些用户 SCSI Ultra320 驱动器和机箱通过 u320 连接与控制器通信,控制器通过 4 Gb 32 端口光纤通道 SAN 交换机连接到服务器群。我们需要增加一点空间来实现这一变化,但我最关心的是性能和可靠性。我认为我们的总存储量永远不会超过 10 TB 左右。

我对 SAN 的世界还很陌生,现在有点不知所措。在我看来,我们有 3 个主要选项。我们可以在当前系统中添加更多机箱。它最多支持 8 个机箱,而我们现在只有 2 个,所以这是一个非常简单的升级路径。我们还可以升级到 HP MSA 系列的当前一代,即 MSA2000 系列。在我看来,我们的第三个选择是升级到下一代 SAN,即 HP EVA 系列。HP 表示 MSA 系列被视为入门级 SAN,这让我认为我们可能需要更实质性的东西,但我意识到这是营销部门的说法。

如果我们只是在当前控制器上添加一些机箱,我们就有足够的光纤通道端口来连接新服务器,特别是因为我们将淘汰几台旧服务器。如果我们升级到新的 SAN 系统,这就带来了一个问题:是继续使用光纤通道,还是采用更新(通常更便宜)的技术,如 iSCSI 或 FCoE。

我很感激任何评论或回答,如果有任何需要澄清的地方,请直接询问,我会尽量为您提供尽可能多的信息。提前致谢!

答案1

HP MSA1500CS 是一款性能相当弱的设备。我有一台,但我讨厌它。我有点惊讶它能跟上您所述的工作量。我建议升级到 MSA2000 可能并不奇怪。它的存储架构比 1500CS 好得多,而且可以更好地扩展。

如果没有更多数据,我不建议使用 EVA4400(HP 的“入门级企业阵列”)而不是 MSA2000。就扩展性而言,4400 比 MSA2000 更胜一筹,但我不知道您期望什么样的增长。

回复:LeftHand 与 MSA2000

只要您有以太网,LeftHand 单元的扩展能力就应该远远超过 MSA2000。它使用的分布式存储控制器使这种事情变得容易。您将为每个存储架支付更多费用,但您可以用它扩展到荒谬的数量。一旦您开始达到 MSA2000 上的 I/O 上限(这将取决于您使用的驱动器技术以及您可以使用的任何主动/主动配置),您就基本完成了。对于 LeftHand 产品来说,这个上限要模糊得多。

LeftHand 方法真正能帮到您的是奇偶校验 RAID。发生故障后进行重建是最耗 CPU 的事情,而我的 MSA1500cs 就是在这一点上一败涂地。在我的 1500cs 上,重建 6.5TB 磁盘上的 RAID6 阵列大约需要一周时间,在此期间,它无法容忍对阵列上的任何内容进行大规模 I/O 写入。由于 LeftHand 在每个机柜中都有一个控制器,因此在一个机架上重新划分 LUN 不会影响其他机架上 LUN 的性能。这非常好!

总而言之,如果您有足够的预算,LeftHand 设备的使用寿命应该比 MSA2000 更长。

答案2

假设你需要坚持使用 HP(这没有什么大错),看看最近收购的HP LeftHand SAN 解决方案,它们是 HP 或其他任何公司在 SAN 存储方面销售的最现代产品。他们销售一种名为“HP LeftHand P4300 4.8 TB Starter SAN Solution”的捆绑版本,它与您上面提供的一般详细信息非常吻合。

但是,如果您对现有的 MSA1500cs 性能和功能感到满意,那么就没有必要将其拆除并更换,除非它的保修期已到,而延长支持合同的费用又太高。

答案3

我对 HP 的存储产品没有特别的经验,所以这只是一般性建议。您需要退后一步,对需要\想要使用 SAN 存储的系统的性能要求进行彻底分析。容量是一个指标,但更重要的是,您需要掌握 IO 模式 - 一段时间内每台服务器\服务的平均和峰值 IOPS 负载。按卷细分这些,看看可以\应该拆分什么,以了解这些卷需要什么样的性能和容量配置文件。然后看看哪种磁盘组合(容量、每个磁盘的 IO、RAID 类型)可以满足您的需求。

作为初始容量估算的(非常粗略的)经验法则:SAS 驱动器 - 7200 rpm 驱动器的持续随机 IOPS 约为 70-90,10k 驱动器的持续随机 IOPS 约为 100-120,15k 驱动器的持续随机 IOPS 约为 150-170。有些驱动器会更好,有些工作负载允许更高的 IOPS,但请将其用于最坏情况的持续基准。

对于任何常规 RAID 类型(10、5、6、50)的 N 驱动器阵列,随机读取 IOPS 将接近每个驱动器的 N*IOPS。随机写入性能会受到损失(RAID 10 为 50%,RAID 5\50 为 75%,RAID6\60 为 >75%)。顺序读取 IO 性能为 RAID 10>50>60>5,但差异并不大。顺序写入类似,但差异更显著。RAID 6 和 60 具有很强的弹性,但重建时间非常长,并且重建过程中整个包的性能会下降。

不要忽视批量顺序性能——您将需要大量的顺序性能来进行备份。

如果您想使用硬件快照\复制,则需要考虑容量和与之相关的性能开销。良好的快照技术本身不会增加 IO 开销,但如果您开始在多个系统上安装快照,则额外的 IO 负载会增加。从容量角度来看,快照可以使用从基本卷大小的 10% 到 >100% 的任何内容。

请记住,我上面提到的基线 IOPS 数字是存储阵列控制器的写缓存过载的最坏情况扩展场景,理想情况下您希望避免这种情况,但您需要知道底层磁盘是否可以处理负载。

请记住,您需要考虑如何从磁盘组合中划分与存储卷相关的各种负载,并且您需要确保将重 I/O 负载分开,并将其放置在具有足够主轴的磁盘组上,并且 RAID 类型(例如 10 或 50)可以提供(相对)高性能。批量低性能存储应放在更便宜(更慢)的磁盘上,并配置为 RAID 5。

一旦你对组合有了很好的了解,看看可用的存储解决方案是否能够提供这些特性以及配置是什么样子。然后去寻找价格。

注意,我完全忽略了网络部分 - 您也需要查看它,但大多数情况下,2G\4G FC \ 几个 iSCSI GigE 端口将允许您在任何入门级 SAN 上饱和随机 IO。例如,单个 GigE 接口应该能够处理 >10000 个小(<4K)随机 IOPS。如果您的负载主要面向顺序 IO,那么您需要拥有许多粗管道 - 少至 2 个 10k 磁盘就可以比单个 GigE 网络链路(>125Meg/秒)更快地传输数据,而 8 驱动器 RAID 10 阵列(>500Meg/秒)将使 4G FC 陷入困境。

答案4

有趣的问题 - 谢谢。我也是惠普的用户,对你提到的所有产品都很了解。

显然,我们可以花很长时间来解决这个问题,但如果预算允许的话,我建议您执行以下操作:

HP BL490c G6 刀片服务器位于 C7000 机箱中,每个刀片服务器都可以使用双四核 Xeon(我会选择 E5540,因为它具有不错的每瓦性能),它们有 18 个内存插槽,因此可以使用“最佳”4GB 内存模块的 72GB 内存,并有一个 64GB SSD 来启动。如果您有预算,我会选择一对“Flex-10 Virtual Connect”互连来连接您的交换机,以及一对“4Gbps FC Virtual Connect”互连来连接您的存储。

然后我会选择内置 20 端口 4Gbps FC 交换机的 EVA 4400 - 这是一台双控制器机器,物有所值,功能强大,而且配置和管理起来非常容易。它还可以扩展到相当大的级别(我记得是 96 个磁盘)。我很想先买一个磁盘架,上面有 12 个 450GB 15krpm SAS 磁盘,然后再根据需要添加更多磁盘架。

然后您可以在这些机器上运行 ESX 3.5 或 4,它将在各个方面表现得非常出色,并且如果您愿意,您可以添加另一个机箱,将服务器拆分到机箱之间以提供额外的弹性。

我推荐这些产品的原因是我们广泛使用这种组合 - 我们有数百个以这种方式配置的机箱和数千台服务器(尽管您可能希望考虑 BL460c G6,它只有 12 个内存插槽(48GB),但如果您想要比单个 SSD 更具弹性,它确实需要 2 个磁盘)。我们还使用了许多 EVA(主要是 8100 和 8400,但我们的测试套件中也有很多 4400),所有这些在 ESX 3.5 上运行良好。有了这个组合,我晚上睡得很好,如果它符合您的预算,那么我想您也会的。

相关内容