调试网络数据包丢失的原因

调试网络数据包丢失的原因

前言

我目前正在测试一个在 上运行的应用程序RHEL 6。我的测试设置是将应用程序安装在嵌入式设备上,通过以太网电缆连接到 PC,该 PC 与运行 Linux 的 PC 上的虚拟机进行通信。PC 上的虚拟机(在 VMWare Workstation 上)和嵌入式设备上都有一个静态 IP 地址,因为它们需要通过以太网电缆相互通信。

pub-sub在这种情况下,应用程序需要使用工具进行通信RTI DDS。这已在无线环境和另一个有线环境中进行了测试,使用不同的 PC 但使用相同的虚拟机,并且在这两个环境中,发布-订阅均已运行。

问题:

在当前设置上测试发布-订阅时,我们可以看到wireshark嵌入式设备发送的所有碎片数据包都被发送到 PC 的主操作系统(在本例中为 Windows)。但是,当碎片数据包从主操作系统发送到虚拟机操作系统时,虚拟机只会收到最后一个收到的数据包,如中所示,wireshark其余数据包将被丢弃。

到目前为止,我们已尝试禁用firewallspinging设备,但一切正常,没有问题。因此,我们无法了解数据包丢失的原因。

有什么方法可以调试网络数据包被丢弃的原因和方式,甚至可能通过 wireshark 来调试,因为我们目前正在使用该工具?

答案1

从总体上来说,我怀疑 MTU(帧大小)是问题的根源。我有几个理由和一些建议。

首先,此行为因 L2 而异(它只发生在有线流量中,而不是无线流量中)。这本身就很可疑,表明接口级别存在问题。

其次,数据包碎片是 MTU 错位的症状。数据包碎片本身并不是问题,但它不是最佳选择,因为它会产生开销和额外的故障点。

第三,Linux 客户虚拟机仅接收“最后一个收到的数据包”,这是某些 VMware NIC 和版本的已知问题。

现在,由于主持人收到任何案件,并且自MTU 大小仅影响发送的数据包,您无法更改虚拟机上的 MTU 并期望获得任何不同的结果。但是,您可以执行以下操作:

建议

确定 MTU 是否存在问题

ping -f -l (your host vm adapter mtu, which is a #) your.guest.ip.or.name,像ping -f -l 1500 myguest

如果使用-l当前 MTU 的值时它有效,那么我错了,请忽略。否则,继续降低该-l值直到它响应,然后将主机虚拟适配器设置为具有该 MTU。请参阅http://www.thincomputing.net/2011/06/28/mtu-size-mismatch-a-major-cause-of-disconnections/

使用不同的 vNic司机在 VMware 工作站中

某些操作系统、某些 vNic 和某些虚拟机管理程序存在已知问题。我在下面列出了一些已知的 vmware 问题的研究,但只需尝试在客户机上使用不同的 vNIC 驱动程序即可。如果您使用的是 E1000,请尝试较新的驱动程序之一。如果您使用的是 vmxnet3,请尝试 2​​ 或 E1000。等等。如果这可以解决问题,您可以保留它或查找之前使用的特定驱动程序以了解如何从 vmware 中修复它。

在主机上尝试使用较低的 MTU

将主机上的 MTU 从现在的值(可能约为 1500)降低到 1380 左右。如果问题消失,继续增加它,直到达到 1468 左右。保留它。

相关内容