Heartbeat/DRBD 故障转移未按预期工作。如何使故障转移更加稳健？

Question 1

我猜你必须实施一些监控来检查你的主系统是否按预期运行。如果任何检查失败，你应该关闭服务器（通过 IPMI/ILO 或交换式 PDU）并让心跳完成其工作。

我认为你总会发现它不能按照你期望的方式工作的情况。

Answer

我猜你必须实施一些监控来检查你的主系统是否按预期运行。如果任何检查失败，你应该关闭服务器（通过 IPMI/ILO 或交换式 PDU）并让心跳完成其工作。

我认为你总会发现它不能按照你期望的方式工作的情况。

Question 2

这不是完美的解决方案，但 2-3 年前我在使用较旧的系统时遇到过这个问题drbd。我所做的是在两个主机上添加一个脚本，cron检查实际主机是活动主服务器还是从服务器。如果它在从服务器上，它会检查 NFS 目录中的某个已知文件是否可用。如果没有；我认为 NFS 已损坏；它会通过 sshpower off命令发送。您可以尝试按照这种方式工作。我相信它们有更好的方法。这个对我来说已经足够好了。

Answer

这不是完美的解决方案，但 2-3 年前我在使用较旧的系统时遇到过这个问题drbd。我所做的是在两个主机上添加一个脚本，cron检查实际主机是活动主服务器还是从服务器。如果它在从服务器上，它会检查 NFS 目录中的某个已知文件是否可用。如果没有；我认为 NFS 已损坏；它会通过 sshpower off命令发送。您可以尝试按照这种方式工作。我相信它们有更好的方法。这个对我来说已经足够好了。

Heartbeat/DRBD 故障转移未按预期工作。如何使故障转移更加稳健？

答案1

答案2

相关内容