我有一个戴尔刀片机箱,上面有 14 个刀片和 ESXi 5.5。在刀片 7 和 14 上,当我 ping ESXi 管理接口时,大约有 65% 的数据包丢失。在所有其他刀片上,没有数据包丢失。奇怪的是,当我从以下位置 ping 时,会出现此数据包丢失:
刀片 1 至刀片 7 = 65% 数据包丢失
但是,当我同时从刀片 7 ping 到刀片 1 时,我从刀片 1 ping 到刀片 7,根本没有数据包丢失……无论是从 1 到 7 还是从 7 到 1
刀片 1 至刀片 7 以及刀片 7 至刀片 1 = 0% 数据包丢失
我已在 ESX CLI 中增加了 Rx 缓冲区,但无济于事。当我执行 esxtop 并转到网络选项卡时,我没有看到任何数据包丢失
PORT-ID USED-BY TEAM-PNIC DNAME PKTTX/s MbTX/s PKTRX/s MbRX/s %DRPTX %DRPRX 33554433 Management n/a vSwitch0 0.00 0.00 0.00 0.00 0.00 0.00 33554434 vmnic0 - vSwitch0 22.73 0.04 44.50 0.10 0.00 0.00 33554435 Shadow of vmnic0 n/a vSwitch0 0.00 0.00 0.00 0.00 0.00 0.00 33554436 vmnic1 - vSwitch0 43.39 0.08 1.91 0.00 0.00 0.00 33554437 Shadow of vmnic1 n/a vSwitch0 0.00 0.00 0.00 0.00 0.00 0.00 33554438 vmk0 all(2) vSwitch0 3.66 0.01 1.91 0.00 0.00 0.00
我唯一看到的是 0xef 有大量中断:
VECTOR COUNT/s TIME/int COUNT_0 COUNT_1 COUNT_2 COUNT_3 COUNT_4 COUNT... 0xef 4435.5 1.0 309.2 275.6 402.9 30.5 339.0 15.3 ...
交换机日志文件显示,刀片网卡有时会出现抖动,我说的“有时”是指每周一次或两次,持续约 1 或 2 分钟。
我不认为这是原因,但我不知道问题可能出在哪里。特别是 ping 和 counter ping 的情况对我来说毫无意义。也许你能帮助我?
答案1
我找到了问题和解决方案。
数据包丢失是由不同交换机端口上的相同 MAC 地址引起的。
虚拟接口 VMK0 Blade 7 具有与 Blade 11 的硬件接口相同的 MAC。
所以我做了以下事情:我给 VMK0 接口一个新的 MAC 地址。为此,我通过 Blade Enclosure 的 iDRAC 接口登录到 ESXi“GUI”。我从管理界面移除了两个网卡,重新启动管理网络,添加它们并再次重新启动管理网络。因此我有一些停机时间,但此后 MAC 地址已更改,不再有数据包丢失。