我们的服务器内存有问题,导致长时间停机,而他们发现问题后才修复,我们面向客户的应用程序不得不停机一段时间。我们正在想出一个即时故障转移的解决方案,但不确定最具成本效益的方法是什么。Windows 服务器群集是实现此目的的最佳方法吗?另外请注意,如果这有区别的话,我们正在使用 Parallels Virtuozzo。我们发现 Parallels 有一个记录的方法来设置它,但它说它需要一个域控制器以及与共享存储的光纤连接,真的只需要这些吗?
谢谢。
答案1
冗余有几种不同的形式。如果您谈论的是硬件冗余,那么 Windows 集群是一个非常好的选择。在 badRAM 情况下,您可以故障转移到被动节点,停机一分钟左右,然后可以专注于修复另一个节点,而不必承受完全停机的压力。
Windows 集群运行良好,但如果您以前从未使用过它,则需要一段时间才能学会。您绝对应该先在实验室中测试一下,并给自己充足的时间来测试故障转移、故障恢复等,这样在投入生产之前,您就会感到很舒服。
域控制器要求存在,因为您需要集群能够在两个节点上的相同安全上下文中运行,而本地帐户无法提供这一点。相反,您使用域帐户作为集群帐户。如果您还没有域,您还需要考虑域的冗余 - 只需一对域控制器即可轻松实现。
共享存储是必需的,因为您需要某种形式的存储,以便集群的两个节点都可以访问。这可以是光纤 SAN 存储或 iSCSI - 无论您有什么可用的东西,如果您从头开始,那里有很多选择。
集群的另一个优点是,当您需要对活动节点(Microsoft 更新、固件更新等)执行维护时,您可以进行快速故障转移,并且整个系统不必在该操作期间关闭。
互联网上并不缺乏有关集群的信息。这是一个好的开始。
答案2
这是必需的。
Windows 群集使用 activevive 目录来配置其某些方面。也就是说,如果两台计算机都有一个仅用作域控制器的虚拟实例,并且您在外部使用第三台计算机作为 PDC 模拟器(小型/便宜的计算机),那么就没问题了。
共享存储 - 是的,Fire 不行。你应该可以使用 ISCSI。它之所以必不可少,主要是因为它基本上可以让服务器进行故障转移 - 而无需不断同步磁盘。所有大型集群解决方案都假设存在 SAN。
你的 RAM 怎么会坏呢?我的意思是,ECC RAM 坏了之后也不会像疯了一样尖叫 ;)