网络流量饱和导致故障转移

网络流量饱和导致故障转移

我有一个 Windows 故障转移群集,每次我从该群集进行远程 robocopy 备份时,似乎都会导致网络饱和度过高,以至于群集监视器认为 NIC 没有响应,然后进行故障转移。

这是我根据通常发生这种情况的时间做出的假设。

我尝试在 robocopy 中添加 /IPG 标志,以允许数据包之间留出一些空间。我还能考虑其他什么方法来分散流量?我遇到过与 robocopy 无关的类似问题。也许是网络接口调整?

谢谢。

答案1

在没有运行 Robocopy 作业的正常时间内查看网络。您是否看到拥塞?您是否看到大量广播流量?链接是否饱和?查看链接速度和双工设置。

一般来说,在开始调整服务器和/或交换机设置之前,先查看一下整个网络。了解某些东西何时无法正常工作的关键是了解它在正常工作时是什么样子。如果网络在正常状态下表现不佳,那么 Robocopy 作业的额外负载只会加剧这种情况。

编辑

此外,根据您的配置,您可以阻止集群通信(心跳流量)通过您正在执行 Robocopy 作业的网络传输。如果 Robocopy 作业在 iSCSI 网络上运行,那么您一开始就不应该在该网络上启用集群通信。

相关内容