诊断 Ubuntu 中的数据包丢失/高延迟

Question

如果网络中任何部分已饱和，或者网络中的任何链接出现错误，则可能会出现数据包丢失。除非问题恰好出在交换机到服务器的电缆连接处，否则这不会显示在接口错误计数中。如果问题出在网络中的其他地方，则显示为数据包丢失。

如果您有 TCP 流量，您可能会发现此问题，因为内核中有计数器可以跟踪 TCP 采取恢复步骤来处理流中丢失的数据包。请查看-s上的 (stats) 选项netstat。显示的值是计数器，因此您需要观察它们一段时间才能了解什么是正常的，什么是异常的，但数据就在那里。retransmit和data loss计数器特别有用。

[sadadmin@busted ~]$ netstat -s | egrep -i 'loss|retran'
2058 segments retransmited
526 times recovered from packet loss due to SACK data
193 TCP data loss events
TCPLostRetransmit: 7
2 timeouts after reno fast retransmit
1 timeouts in loss state
731 fast retransmits
18 forward retransmits
97 retransmits in slow start
4 sack retransmits failed

有些工具会对这些值进行采样并为您绘制趋势图，这样您就可以轻松发现何时出现了问题。我使用穆宁。

Answer 1

如果网络中任何部分已饱和，或者网络中的任何链接出现错误，则可能会出现数据包丢失。除非问题恰好出在交换机到服务器的电缆连接处，否则这不会显示在接口错误计数中。如果问题出在网络中的其他地方，则显示为数据包丢失。

如果您有 TCP 流量，您可能会发现此问题，因为内核中有计数器可以跟踪 TCP 采取恢复步骤来处理流中丢失的数据包。请查看-s上的 (stats) 选项netstat。显示的值是计数器，因此您需要观察它们一段时间才能了解什么是正常的，什么是异常的，但数据就在那里。retransmit和data loss计数器特别有用。

[sadadmin@busted ~]$ netstat -s | egrep -i 'loss|retran'
2058 segments retransmited
526 times recovered from packet loss due to SACK data
193 TCP data loss events
TCPLostRetransmit: 7
2 timeouts after reno fast retransmit
1 timeouts in loss state
731 fast retransmits
18 forward retransmits
97 retransmits in slow start
4 sack retransmits failed

有些工具会对这些值进行采样并为您绘制趋势图，这样您就可以轻松发现何时出现了问题。我使用穆宁。

诊断 Ubuntu 中的数据包丢失/高延迟

答案1

相关内容