针对 iSCSI/NFS 性能非常差的故障排除策略

Question 1

似乎这里有一个共同的主题，请再次查看交换机上的流量控制设置。如果交换机有以太网计数器统计信息，请查看它们并查看是否有大量以太网 PAUSE 帧。如果是，那可能就是您的问题。通常，禁用交换机上的 QOS 可以解决此问题。

Answer

似乎这里有一个共同的主题，请再次查看交换机上的流量控制设置。如果交换机有以太网计数器统计信息，请查看它们并查看是否有大量以太网 PAUSE 帧。如果是，那可能就是您的问题。通常，禁用交换机上的 QOS 可以解决此问题。

Question 2

这样的流量对我来说意味着各种 TCP 流量控制方法无法正常工作。我发现 Linux 内核与 Vista 之后的 Windows 版本通信时存在一些问题，并且吞吐量也类似。如果您查看一下，它们在 Wireshark 中显示得相当好。

最糟糕的可能性是 TCP 延迟确认完全中断，您将看到如下流量模式：

packet
packet
[ack]
packet
packet
[ack]

我已通过将 NIC 驱动程序更新应用于 Windows 服务器解决了该问题。某些 (broadcom) 服务器附带的智能 NIC 有时会以有趣的方式发生故障，这就是其中一种。

正常的流量模式是大量数据包后跟一个 Ack 数据包。

另一个需要注意的是长时间延迟。可疑值是 0.2 秒和 1.0 秒。这表明一方没有得到预期的结果，正在等待超时后再回复。将上述不良数据包模式与 ACK 的 200ms 延迟相结合，您将获得高达 1MB/s 的吞吐量。

这些都是很容易被注意到的不良交通模式。

我没有使用过这种 NAS 设备，因此不知道如何调整它来修复发现的问题。

Answer