子网上的特定机器随机失去连接,但网络的其余部分正常

子网上的特定机器随机失去连接,但网络的其余部分正常

每台物理机都连接到思科交换机,并且位于同一网络 192.168.1.0/24

我拥有的每台服务器都运行 Centos 6.5。有几台运行 KVM 和一堆虚拟机。大多数机器都绑定了网卡。

机器:

虚拟服务器(vs0)有一堆虚拟机(vm00、vm01)

虚拟服务器(vs1)有一堆虚拟机(vm10、vm11)

然后我还有一些其他随机物理机器(web0,web1)

正常情况下,一切正常,但偶尔某些机器会失去连接。

web0 无法 ping vm11

web0 可以 ping web1、vs0、vm00、vm01、vs1、vm10

vm11 无法 ping web0

vm11 可以 ping 通 web1、vs0、vm00、vm01、vs1、vm10

所有其他机器都可以 ping 所有其他机器

30 分钟后,一切又恢复正常。

有时,web0 看不到 web1,因此我认为这不是 KVM 的问题。当 web0 看不到 vm11 时,web0 可以看到 vs1,因此我认为这不是网卡问题。

我尝试在机器上使用 tcpdump,除了 ARP 数据包之外,没有任何数据包到达机器。我不知道还要寻找什么。我不知道该如何调试。有什么想法吗?

答案1

我想知道问题是否与绑定的方式有关,以及交换机是否与端口上的 MAC 地址混淆等。

我猜你正在使用“模式 0”进行绑定。尝试将一切更改为模式 1(主动备份),或(暂时)删除每个设备上的一个底层绑定接口,看看这是否会使一切更稳定。

相关内容