VM 从一个 ESXi 主机迁移到另一个 ESXi 主机会导致出现非常可重现的奇怪图形签名:
我不知道为什么会发生这种情况。ESXi 服务器是 Dell PowerEdge 2850,其 vKernel 端口使用 Intel PRO/1000 MT。有问题的交换机是 Dell PowerConnect 6248。我们所有的 2850 都出现了这个问题。我没有对更复杂的 ESXi 配置选项进行任何更改。在同一交换机上运行 ESXi 5 的两个 2950 之间传输相同的文件将产生一个平均约为 70MB/s 的良好一致图表。
任何见解或建议都非常感谢,即使见解是“PE2850 已经过时,不适合虚拟化”。不反对购买网络硬件。谢谢!
答案1
我同意 Nathan 的观点,这看起来像是接收器上的缓冲区已填满。您可以通过数据包捕获来确认这一点,查找返回“TCP 零窗口”的接收器。这是接收器在说“停止,你发送了太多信息给我!”
另一个可能的原因可能是发送方的 TCP 分段卸载 (TSO)。这些旧e1000
卡只有 64k 缓冲区来处理卸载。如果您正在进行大型 TCP 传输并占用了此缓冲区,您将看到传输系统上记录的“TX Unit Hang”消息。当缓冲区溢出时,NIC 中的传输单元会重置,这会导致在传输恢复之前流量暂时停止。禁用 TSO 可以解决这个问题,通过获取更好的 NIC 来解决它。
答案2
我从未解决过这个问题,但我能够在其他几个运行 ESXi 4.X 的主机上重现此图形签名。解决方案总是升级到 ESXi 5.0+。