Heartbeat 尝试故障转移节点但主节点仍在运行

Question 1

不，时钟不准不会破坏关系。但是，如果时钟发生剧烈变化，则会导致日志中出现错误，错误内容如下：

heartbeat: 2004/11/10_21:08:49 info: Clock jumped backwards. Compensating.

但它不会摧毁主节点。

看起来服务器之间的通信中断了。具体来说，看起来服务器 1 不再能够发送数据，或者服务器 2 无法正常接收数据。这可能是由于某些缓冲区问题造成的。您是否在跟踪网络缓冲区空间？（通过 snmp 或 netstat）或者可能是某个地方的网络问题，交换机端口错误？

当您说网站瘫痪时，您是否对每个 serverX 上的服务进行了监控测试，并针对该服务器的特定 IP 进行了测试？除了 VIP 无法工作之外，它是否表明在此期间是否有任何服务器瘫痪？流量图或错误/丢失计数是否显示了该时间段内的任何有趣信息？

Answer

不，时钟不准不会破坏关系。但是，如果时钟发生剧烈变化，则会导致日志中出现错误，错误内容如下：

heartbeat: 2004/11/10_21:08:49 info: Clock jumped backwards. Compensating.

但它不会摧毁主节点。

看起来服务器之间的通信中断了。具体来说，看起来服务器 1 不再能够发送数据，或者服务器 2 无法正常接收数据。这可能是由于某些缓冲区问题造成的。您是否在跟踪网络缓冲区空间？（通过 snmp 或 netstat）或者可能是某个地方的网络问题，交换机端口错误？

当您说网站瘫痪时，您是否对每个 serverX 上的服务进行了监控测试，并针对该服务器的特定 IP 进行了测试？除了 VIP 无法工作之外，它是否表明在此期间是否有任何服务器瘫痪？流量图或错误/丢失计数是否显示了该时间段内的任何有趣信息？

Question 2

需要更多信息。

物理拓扑。这些主机如何物理地相互连接？
每个主机的心跳配置 (ha.cf) 和 iptables 规则。具体来说，您使用的是广播 (bcast)、多播 (mcast) 还是单播 (ucast)。另外，请指定心跳的版本。

我怀疑有什么东西在过滤你的心跳节点之间的流量。Iptables 是一种可能。根据你的物理拓扑，其他设备也可能是可疑的。

Answer

需要更多信息。

物理拓扑。这些主机如何物理地相互连接？
每个主机的心跳配置 (ha.cf) 和 iptables 规则。具体来说，您使用的是广播 (bcast)、多播 (mcast) 还是单播 (ucast)。另外，请指定心跳的版本。

我怀疑有什么东西在过滤你的心跳节点之间的流量。Iptables 是一种可能。根据你的物理拓扑，其他设备也可能是可疑的。

相关内容