我们正在对 4 节点 VCS 集群进行每两年一次的弹性测试。两个应用程序分别在节点 1-3 和 2-4 上以主动-备用模式运行。
当在一个节点上进行手动切换或正常关闭时,应用程序将顺利切换到另一个节点。
然而,当我们关闭或重置一个节点时,受影响节点的切换缺失似乎会触发重新启动其他集群节点。此外,如果发生关闭,其余节点会重新启动,但无法加入集群. 当被关闭的服务器恢复时,所有人重新加入。
显然,这完全违背了集群的初衷。提供应用程序和集群软件(以及硬件)的供应商认为这种情况不现实,服务器在发生故障时总会很好地进行交接。
我们不擅长专有集群技术,因此,虽然我们认为他们的陈述是错误的,但我们不知道可能出了什么问题。然而,我怀疑任何商业上成功的集群软件都可以处理这些情况,但我们的实施存在配置错误。
任何线索都将不胜感激。