NFS 陷入 ack 循环

NFS 陷入 ack 循环

我遇到过这种情况:三个不同的 NFS 客户端中的一个会在一段时间(几天)后崩溃。我发现崩溃的主机和服务器不断发送“ack”数据包(速度高达 100+mb/s)。每一方都发送相同的数据包,并且双方都不会重新传输任何实际数据。1 最终,服务器将重置连接,NFS 将在短时间内(2-4 分钟)正常运行。服务器重新启动将修复所有问题,直到几天后出现故障。

该环境是其他环境的重复,其他 NFS 客户端从未出现过此问题(相同的操作系统和应用程序版本)。

在进行故障排除时,我看到 wireshark 将数据包报告为“TCP ACKed unseen 段”,但我不明白为什么。数据包 #28517 的 Ack=2194563093 和数据包 #28513 的 Seq=2194563093... 这是被确认的数据包,对吗?我又进行了一次干净的捕获,结果看起来一样,所以我不明白为什么它会这样显示。2

我主要寻找调试 NFS 问题的提示(客户端上的 SLES,服务器端上的 EMC VNX)并确认 wireshark 输出是错误的(否则这是我应该深入研究的实际线索)。

编辑:服务器和客户端位于同一交换机、同一子网。

相关内容