我们公司有一些独立的 ESXi 主机。最近我们遇到了一个奇怪的问题,ESXi 主机的 mac 地址发生了变化。
问题描述:
我发现部分esxi主机的IP偶尔会出现ping不通的情况,但是该主机上的vm网络不会中断,此时如果在同一VLAN内的某台服务器上ping一下ESXi主机的IP,ESXi主机网络就会恢复。
一开始以为是网卡的EEE功能问题,于是升级了ESXi版本(ESXi 6.5 -6.7-7.0),禁用了igbn驱动,启用了ign驱动,禁用了EEE功能,但是这些都不管用。
最后发现,问题发生的时候,ESXi主机的MAC会flap到G2/1口,G2/1口连接深信服门禁设备,AC设备连接防火墙。mac flapping log:
Jun 30 12:38:13.923 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 08:94:EF:30:BB:D0 in vlan 99 is moving from port Gi2/1 to port Gi2/16
Jun 30 12:38:23.491 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 40:F2:E9:96:EF:72 in vlan 99 is moving from port Gi2/1 to port Po10
Jun 30 12:45:17.847 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 40:F2:E9:96:E9:7A in vlan 99 is moving from port Gi2/1 to port Gi2/33
Jun 30 12:45:20.231 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 00:50:56:6F:76:8C in vlan 99 is moving from port Gi2/1 to port Gi2/29
Jun 30 12:45:20.287 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 00:50:56:66:89:DB in vlan 99 is moving from port Gi2/1 to port Gi2/29
Jun 30 12:45:20.327 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 00:50:56:6A:88:90 in vlan 99 is moving from port Gi2/1 to port Gi2/29
Jun 30 13:12:15.275 GMT: %C4K_EBM-4-HOSTFLAPPING: Host 08:94:EF:30:C3:40 in vlan 99 is moving from port Gi2/1 to port Gi2/16
Jun 30 13:16:26.499 GMT: %C4K_EBM-4-HOSTFLAPPING: Host BC:97:E1:86:0B:AC in vlan 99 is moving from port Gi2/1 to port Gi2/16
我们的方案:
- 2台cs4506交换机配置了portchannel
- 每个 ESXi 主机都连接到 cisco cs4506
- ESXi主机端口配置为访问
- 交换机与 ESXi 服务器之间没有端口通道或 LACP
- VLAN99 中的 ESXi 主机
以下是我采取的一些故障排除步骤:
1.交换机的CPU使用率不高,并且该问题仅发生在ESXi主机上。我不认为这是由网络环路引起的。
JD1KY2F-CS4506-01#show process
CPU utilization for five seconds: 22%/1%; one minute: 20%; five minutes: 20%
2.深信服论坛上有人说可能是STP导致的,于是我查看了交换机的STP更新时间,和日志中出现震荡的时间不符。
JD1KY2F-CS4506-01#show spanning-tree detail | in ieee|from|occur|is exec
VLAN0099 is executing the ieee compatible Spanning Tree protocol
Number of topology changes 19461 last change occurred 4d12h ago
from GigabitEthernet2/5
3.根据此知识库发生故障转移或故障回复事件时,STP 可能会导致网络连接暂时丢失 (1003804).我设置了 portfast 但是不起作用。
4.交换机mac地址表中没有重复的ESXi主机MAC。
目前,我正在 ESXi 主机端口上配置端口安全以避免 MAC 翻转:
interface GigabitEthernet2/11
switchport access vlan 99
switchport mode access
switchport port-security maximum 50
switchport port-security
switchport port-security violation restrict
但这只是一个临时解决方案。我想在 ESXi 主机和交换机之间配置一个端口通道,所以我需要解决这个问题。你们有什么建议吗?谢谢。