我有一个戴尔刀片机箱,上面有 14 个刀片和 ESXi 5.5。在刀片 7 和 14 上,当我 ping ESXi 管理接口时,大约有 65% 的数据包丢失。在所有其他刀片上没有数据包丢失。
奇怪的是,当我从以下位置 ping 时,出现数据包丢失:
刀片 1 到刀片 7 -> ~ 65% 数据包丢失
但是,当我同时从刀片 7 ping 到刀片 1 时,当我从刀片 1 ping 到刀片 7 时,我根本没有丢包……既不是从 1 到 7,也不是从 7 到 1
刀片 1 到刀片 7 && 刀片 7 到刀片 1 -> 0% 数据包丢失
我在 ESX CLI 中增加了 Rx 缓冲区,但没有帮助。当我执行esxtop
并转到网络选项卡时,我没有看到任何数据包丢失:
PORT-ID USED-BY TEAM-PNIC DNAME PKTTX/s MbTX/s PKTRX/s MbRX/s %DRPTX %DRPRX
33554433 Management n/a vSwitch0 0.00 0.00 0.00 0.00 0.00 0.00
33554434 vmnic0 - vSwitch0 22.73 0.04 44.50 0.10 0.00 0.00
33554435 Shadow of vmnic0 n/a vSwitch0 0.00 0.00 0.00 0.00 0.00 0.00
33554436 vmnic1 - vSwitch0 43.39 0.08 1.91 0.00 0.00 0.00
33554437 Shadow of vmnic1 n/a vSwitch0 0.00 0.00 0.00 0.00 0.00 0.00
33554438 vmk0 all(2) vSwitch0 3.66 0.01 1.91 0.00 0.00 0.00
我唯一看到的是有大量中断0xef
:
VECTOR COUNT/s TIME/int COUNT_0 COUNT_1 COUNT_2 COUNT_3 COUNT_4 COUNT...
0xef 4435.5 1.0 309.2 275.6 402.9 30.5 339.0 15.3 ...
交换机日志文件向我显示,刀片网卡有时会抖动,当我说有时时,我的意思是每周一次或两次,持续约 1 或 2 分钟。
我不认为这是原因,但我不知道问题出在哪里。尤其是 ping 和 counter ping 的情况对我来说没有任何意义。
也许你可以帮助我?
答案1
好吧,我找到了问题和解决方案。
我得到了不同交换机端口上相同 MAC 地址的丢包原因。
虚拟接口 VMK0 Blade 7 与 Blade 11 的硬件接口具有相同的 MAC。
所以我所做的是,为 VMK0 接口提供一个新的 MAC 地址。为此,我检查了 Blade Enclosure 的 iDRAC 界面并登录到 ESXi“GUI”。我从管理界面中删除了两个网卡,重新启动管理网络,添加它们并再次重新启动管理网络。
所以我有一些停机时间,但之后 MAC 地址发生了更改,并且不再出现数据包丢失。
感谢您的帮助。
托比