我遇到了一个只在少数服务器上发生的问题。每隔 5-6 分钟,我就会与服务器失去连接,几分钟后才能恢复。在大多数情况下,这是因为虚拟机无法访问,而同一主机上的其他服务器可以访问。
我使用 tcpdump 来捕获流量,以下是 pcap 的重要部分:
11:49:03.964855 IP6 :: > ff02::1:ffe5:8fb0: HBH ICMP6,多播侦听器 reportmax 响应延迟:0 地址:ff02::1:ffe5:8fb0,长度 24 11:49:03.964961 IP6 :: > ff02::1:ffe5:8fb0: HBH ICMP6,多播侦听器 reportmax 响应延迟:0 地址:ff02::1:ffe5:8fb0,长度 24 11:49:03.966280 ARP,请求 who-has 84...* 告诉 84...,长度 28 11:49:03.966632 ARP,回复 84... is-at 00:00:5e:00:01:03 (oui 未知),长度46 11:49:03.966643 IP 84....50879 > google-public-dns-a.google.com.domain: 18212+ PTR? 0.bf8.5.eff1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.2.0.ffip6.arpa。 (90) 11:49:08.970373 IP 84....50879 > google-public-dns-a.google.com.domain: 18212+ PTR? 0.bf8.5.eff1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.2.0.ffip6.arpa。 (90) 11:53:18.356686 IP 84...* > *.cable.012.net.il: ICMP 回应答复,id 61593,序号 23533,长度 64 11:53:18.801857 IP6 :: > ff02::1:ffe5:8fb0: HBH ICMP6,多播侦听器 reportmax 响应延迟:0 地址:ff02::1:ffe5:8fb0,长度 24 11:53:18.801973 IP6 :: > ff02::1:ffe5:8fb0: HBH ICMP6,多播侦听器 reportmax 响应延迟:0 地址:ff02::1:ffe5:8fb0,长度 24
最后一个数据包发送后,几分钟内服务器都无法访问。值得一提的是,虽然无法从外部访问服务器,但服务器可以连接到远程服务器(通过直接连接到控制台)。我知道 IPV6 有问题,但我真的不明白为什么。
该设置包含 Juniper 路由器(无法访问路由器)-> L2 交换机 -> Proxmox -> VM
我使用 IPV6 的 Esxi 也遇到了同样的情况,
VM - CentOS release 6.3 (Final) - 2.6.32-39-pve
Proxmox - pve-manager/3.4-6/102d4547 (running kernel: 2.6.32-39-pve)
L2 - Dlink - no special configuration after factory reset.
When the VM is not reachable from the outside, pinging inside the LAN causing the VM be reachable from the world again (only for a few minutes)
在proxmox主机内部:
brctl showmacs vmbr0:(当服务器无法从外部访问时)
1 ee:75:67:e5:8f:b0 no 0.59
当服务器可从世界各地访问时
2 ee:75:67:e5:8f:b0 no 127.15
我尝试更换 L2 交换机,但没有用。安装了一台新服务器和一台新 VM。结果相同。
在虚拟机上禁用 IPv6 后,它就停止了,但我真的不明白为什么。服务器的设置非常简单。
答案1
当您执行 TCPDUMP 时,IPv6 流量是否异常高?我们遇到了类似的问题,这是由网络上的 l217-LM intel 驱动程序故障引起的。简而言之,当使用受影响驱动程序的机器进入睡眠模式时,它们会进入一种状态,其中 2 个或更多机器会不断来回发送 IPv6 消息。这些消息甚至不足以显示为交换机上的异常流量,但有些设备(包括我们的一台多功能打印机和我们的 Sonicwall)无法处理这种特定类型的大量 IPv6 流量,CPU 占用率达到 100%,并且在流量停止之前无法使用。
这里有一个更详细地描述它的线程: http://www.gossamer-threads.com/lists/cisco/nsp/177843
搜索“HBH ICMP6,多播侦听器报告”也会出现类似的问题。
其中一个可能的解决方案是过滤或限制交换机上的多播流量(寻找交换机上的风暴控制功能),就我而言,是修复异常的以太网驱动程序。