当对我们的一台 HP Blade 服务器使用较大的 ping 缓冲区大小时,我可以看到不同的响应时间。使用默认缓冲区大小时,所有服务器的响应时间相同。
作为故障排除的第一步,我比较了同一 c7000 机箱中的两台服务器,其中一台服务器有问题,另一台没有问题。
两台服务器都是 Windows 2k8 R2 BL490c Gen 7 服务器,位于同一 C7000 机箱中,使用相同的机箱网络模块(HP 1/10Gb VC-Enet 模块)
当使用大型 ping 缓冲区对服务器 1 进行 ping 时,我获得一致的 1-2 毫秒响应时间。对于服务器 2,我获得 3-4 毫秒:
ping -l 65500 server1
Pinging server1 [10.100.100.2] with 65500 bytes of data:
Reply from 10.100.100.2: bytes=65500 time=1ms TTL=127
Reply from 10.100.100.2: bytes=65500 time=2ms TTL=127
Reply from 10.100.100.2: bytes=65500 time=1ms TTL=127
Reply from 10.100.100.2: bytes=65500 time=1ms TTL=127
ping -l 65500 server2
Pinging server2 [10.100.100.3] with 65500 bytes of data:
Reply from 10.100.100.3: bytes=65500 time=3ms TTL=127
Reply from 10.100.100.3: bytes=65500 time=4ms TTL=127
Reply from 10.100.100.3: bytes=65500 time=4ms TTL=127
Reply from 10.100.100.3: bytes=65500 time=4ms TTL=127
如果我从不同的源(即从其他机箱中的刀片)执行 ping 操作,则结果一致。两台服务器均使用 2 个绑定的 HP NC553i 双端口 FlexFabric 10Gb 适配器。
我可以看到两台刀片上的刀片和网络适配器固件略有不同 - 服务器 2 上的固件实际上较新。
其他区别是它们位于不同的 VLAN 上,但是我们没有看到其他机箱上同一 VLAN 中的刀片有任何延迟。
我已检查两台服务器上的适配器是否均设置为自动协商。
我应该首先查找哪里来排除故障?目前,我会尽量避免固件更新。