我希望有人能给我指明正确的方向——看起来我对这个主题没有足够的了解,而且时间太紧,我无法深入探索不同的场景。
我们有两个数据中心,彼此相距几英里,通过 100 Mbps 链路连接。每个数据中心将有 5 个 BL490 刀片,ESX Standard 托管约 50 个虚拟机。每个站点都有 HP eva4400 SAN,并设置了 SAN 复制。VC 将位于第一个数据中心,两个数据中心都已联网。
SAN 复制是块级别的,因此似乎我不能只复制更改,而必须复制所有写入。这应该不是问题,因为链接每天可以维持大约 1.8 TB 并且数据可以缓冲。
然而,我很难想象在这种情况下恢复将如何进行。我们不需要即时恢复,我想说 4 小时的恢复时间是可以接受的,因此由于财务原因,像 DR 方案这样的花哨的自动 SRM 不会轻易被接受,但是欢迎任何评论。
目前的想法是:将 LUN 从主站点复制到辅助站点。当发生灾难时,IT 人员打开远程端的 ESX 主机并将复制的 LUN 连接到它们,然后注册虚拟机并更改 IP 地址。
我知道这看起来像是非常糟糕的手动过程,而且我几乎肯定我错过了一些明显的陷阱。
有人能告诉我该往哪个方向走吗?有关这个主题的文章?
这是一个全新的设置,我们宁愿建立基本的恢复过程并在以后扩展它。我只需要有一个正确的方向来实现这种可扩展性。
提前非常感谢您!
答案1
谢尔盖,
我们对两个 EVA 8000 做了类似的事情,只是我们的两个 EVA 相距不到半英里,并通过光纤连接。如果您有热备用 ESX 服务器,那么每次在 EVA 上创建新的源 LUN 时,也将它们呈现给备用 ESX 服务器。默认情况下,它们没有读写访问权限,直到故障转移。每次执行此操作时,或者至少偶尔执行一次,您需要重新扫描 ESX 服务器中的 HBA 以选择新的 LUN。在灾难中,您需要做的就是故障转移 LUN 并重新注册 VM。不明白为什么您需要更改 IP 地址。当然,任何时候都只有一组会打开。此外,如果您可以偶尔测试并注册 VM,那么该步骤也会被删除。
整个过程只需几分钟即可完成,而不是几小时。
答案2
谢尔盖,
我们目前正在进行类似的设计。虽然不是 HP SAN,但可以看看本网站。您可能需要投资 VCenter(以前称为 Virtual Center),您可以在其中注册主机并为虚拟机实现 HA。由于您的复制是块级的,因此虚拟机可以共享存储群集以实现冗余。