过多的“TCP Dup ACK”和“TCP Fast Retransmission”导致网络出现问题。这是什么原因造成的？

Question 1

我意识到这个答案被简化了，并不像我希望的那样明确，所以如果您对某个步骤有疑问，请询问！

在 Wireshark 中打开此文件后向下滚动一点，我们会看到一些不同颜色的帧。看起来很糟糕，对吧？好吧，其实没那么糟糕。稍等一下，我们会到达那里。

检查 SYN 数据包（第 37 帧）后，我们在 TCP 选项中看到 SACK 和窗口缩放。很好。SYN/ACK（第 38 帧）、SACK 和窗口缩放中也出现了同样的情况。太棒了。没有看到任何与 SACK 相关的奇怪之处。

未加载 RTT 的估计值是 SYN 数据包和第一个 ACK（第 39 帧）之间的时间。该值约为 9.3 毫秒，与您的发现相符。请注意，SYN/ACK 和 ACK（第 38 和 39 帧）之间的时间比 SYN 和 SYN/ACK（第 37 和 38 帧）之间的时间要短得多。这意味着此捕获文件是在接收方获取的，要了解为什么这并不理想，我们必须重新学习。

在发送方和接收方之间，有一段网络路径是最小的，这限制了带宽。我们刚刚从握手中获得的 RTT 估计值可以估算出这条网络路径的长度。衡量我们可以在这个管道中容纳多少个数据包的指标是管道容量或带宽延迟积- PC [bits] = R [bits/s] * RTT [s]，其中 R 是最小带宽。管道容量是体积的测量单位。

想象一下花园软管。它的体积也是由长度和宽度来定义的，对吧？为了从中获取最多的水，它需要完全充满水，否则会有气隙限制水流。如果我们设法将它完全装满，它可能会溢出。我们可以使用水桶，这样就不会弄湿地板，而且如果水桶溢出也不会影响水流。

事实证明，在网络路径中情况完全相同。我们需要填充管道……换句话说，管道容量是发送方和接收方之间最小的飞行字节数（管道 + 水桶中的水量），充分利用最小带宽（不造成空气间隙）。因此，如果飞行字节数 > PC，那么我们就没问题了！

查看 TCP 跟踪 统计 -> TCP 流图 -> 时间序列图 (tcptrace)我们可以在 Y 轴上看到字节数，在 X 轴上看到时间。该曲线的导数是字节/秒，或吞吐量。请注意，黑色“线”是平坦的，这意味着吞吐量是稳定的！虽然它被蓝线打断了几次（这些是重复 ACK 中的 SACK 范围），但可以看出它不会影响吞吐量。

看到右下角的灰色实线（稍微放大一点，这就是 ACK）与黑色 TCP 段非常接近了吗？TCP 段和 ACK 之间的时间就是 RTT，这里几乎为 0！这意味着没有太多段经过此捕获点。这反过来意味着我们不能用它来估计正在传输的字节数，这就是发送方数据包捕获更好的原因。

这里的数据包在到达捕获点之前自然丢失。丢失时正在传输的每个数据段都会触发重复 ACK。因此，我们可以使用重复 ACK 的数量来估计数据包丢失时正在传输的字节数。这里我们看到大约 9、16 和 23 个段。每个段有 1448 字节的数据，因此传输的字节数在 13k 到 33k 之间。这里的吞吐量约为 3 Mbit/s（来自IO 图），并且根据我们之前测量的 RTT，我们得到的管道容量小于 3e6 [bits/s] * 10e-3 [s] / 8 字节 = 3750 字节，或者小于 3 个段。

因为这些丢失时飞行中的字节实际上并不相同（由于样本太少很难判断）我无法真正说这些是随机丢失（非常非常糟糕）还是由于队列/存储桶溢出而发生的丢失，但它们发生在飞行中的字节数 > PC 时，因此吞吐量不受影响。

您的回答似乎表明它们确实是随机的，但数量并不多以至于导致吞吐量低。

Answer