1 Gbit/s 上的 AIX 7.1 和 10 Gbit/s 上的 SLES 11 之间的网络性能较差

1 Gbit/s 上的 AIX 7.1 和 10 Gbit/s 上的 SLES 11 之间的网络性能较差

我遇到 SLES 和 AIX 之间的网络性能问题。我测试了网络性能

  • AIX 1 Gbit/s 到 AIX 1 Gbit/s
  • SLES 11 10 Gbit/s 至 SLES 11 10 Gbit/s
  • AIX 1 Gbit/s 至 SLES 11 10 Gbit/s 以及反向

网络上还有其他机器,所以我们没有完整的带宽,但网络绝对不会被其他机器淹没。

通过:

  • 网猫
  • SCP
  • niping(SAP的网络性能测量工具)

在两台 AIX 机器之间,我得到了大约 110 Mbit/s 的“不错”结果 在两台 Linux 机器之间,我得到了大约 2.2 Gbit/s 的良好结果,但是在 Linux 和 AIX 之间,独立于哪个方向,我只得到大约 30 Mbit/s,与所有 3 个测量工具一致。所有测试的适配器都在同一子网中!

路由不是问题。当我进行跟踪路由时,节点直接相互连接,无需通过网关进行跳跃。根据 netstat -i 在任何机器上也没有 Ierrs/Oerrs。通过 ping 进行约 20 分钟的网络稳定性测试也不错。

因此,就我个人而言,我可以排除网络问题的可能性,并将其范围缩小到 AIX 和 Linux 之间的速度协商或缓冲区大小协商。供您参考:所有主机都是 IBM PowerVM 上的逻辑分区(可以说是虚拟机)。有人知道该怎么做吗?

答案1

尝试;

  1. 将路线中的所有电缆更换为新电缆
  2. 将linux和aix隔离为单个交换机上的两台机器(减少测试环境)
  3. 与静态设置交叉补丁(如果可能 - 再次减少)
  4. 如果是开关故障,请用第二个开关进行测试
  5. 进入交换机本身并检查端口上是否有抖动或错误
  6. 在linux上运行wireshark并捕获流量并识别延迟在哪一侧。或者如果发生其他事情。 (如果您无法在本地安装wireshark,请尝试混杂端口并使用第三个盒子进行监控)
  7. 尝试在 UDP 上使用 netcat,因为 udp 没有握手,也许 TCP 及其要求和帧差异是问题的一部分。 信息
  8. 也移动你打过补丁的端口。检查交换机没有打开任何可能会玩鸡的不需要的链路聚合

110mbit/s aix 到 aix 的速度令人印象深刻,表明可能存在问题。 aix 长凳还有其他更好的吗?

尝试使用 mount 传输到 nfs 位置。并尝试简单的 ftp 传输(使用一个大文件,只需计时并进行数学计算即可获得棒球场的感觉)。

请注意,SCP 有加密开销,并且需要大量处理。因此,请使用未加密的传输进行基准测试/计时。

希望这能隔离。

答案2

问题在于 SuSE 11 SP4 的默认内核版本太旧。 DVD 中的内核版本是 3.101.0.63。此内核版本不支持 IBM 专有的 SEA 大发送以及通过 ethtool 调整接收和发送缓冲区大小。我们升级到内核 3.101.0.100。然后我激活了largesend并通过ethtool调整了大小和接收缓冲区大小。现在一切都像魅力一样。我感谢你们给了我激活大发送的想法,否则我就不会找到这个。

相关内容