我遇到 SLES 和 AIX 之间的网络性能问题。我测试了网络性能
- AIX 1 Gbit/s 到 AIX 1 Gbit/s
- SLES 11 10 Gbit/s 至 SLES 11 10 Gbit/s
- AIX 1 Gbit/s 至 SLES 11 10 Gbit/s 以及反向
网络上还有其他机器,所以我们没有完整的带宽,但网络绝对不会被其他机器淹没。
通过:
- 网猫
- SCP
- niping(SAP的网络性能测量工具)
在两台 AIX 机器之间,我得到了大约 110 Mbit/s 的“不错”结果 在两台 Linux 机器之间,我得到了大约 2.2 Gbit/s 的良好结果,但是在 Linux 和 AIX 之间,独立于哪个方向,我只得到大约 30 Mbit/s,与所有 3 个测量工具一致。所有测试的适配器都在同一子网中!
路由不是问题。当我进行跟踪路由时,节点直接相互连接,无需通过网关进行跳跃。根据 netstat -i 在任何机器上也没有 Ierrs/Oerrs。通过 ping 进行约 20 分钟的网络稳定性测试也不错。
因此,就我个人而言,我可以排除网络问题的可能性,并将其范围缩小到 AIX 和 Linux 之间的速度协商或缓冲区大小协商。供您参考:所有主机都是 IBM PowerVM 上的逻辑分区(可以说是虚拟机)。有人知道该怎么做吗?
答案1
尝试;
- 将路线中的所有电缆更换为新电缆
- 将linux和aix隔离为单个交换机上的两台机器(减少测试环境)
- 与静态设置交叉补丁(如果可能 - 再次减少)
- 如果是开关故障,请用第二个开关进行测试
- 进入交换机本身并检查端口上是否有抖动或错误
- 在linux上运行wireshark并捕获流量并识别延迟在哪一侧。或者如果发生其他事情。 (如果您无法在本地安装wireshark,请尝试混杂端口并使用第三个盒子进行监控)
- 尝试在 UDP 上使用 netcat,因为 udp 没有握手,也许 TCP 及其要求和帧差异是问题的一部分。 信息
- 也移动你打过补丁的端口。检查交换机没有打开任何可能会玩鸡的不需要的链路聚合
110mbit/s aix 到 aix 的速度令人印象深刻,表明可能存在问题。 aix 长凳还有其他更好的吗?
尝试使用 mount 传输到 nfs 位置。并尝试简单的 ftp 传输(使用一个大文件,只需计时并进行数学计算即可获得棒球场的感觉)。
请注意,SCP 有加密开销,并且需要大量处理。因此,请使用未加密的传输进行基准测试/计时。
希望这能隔离。
答案2
问题在于 SuSE 11 SP4 的默认内核版本太旧。 DVD 中的内核版本是 3.101.0.63。此内核版本不支持 IBM 专有的 SEA 大发送以及通过 ethtool 调整接收和发送缓冲区大小。我们升级到内核 3.101.0.100。然后我激活了largesend并通过ethtool调整了大小和接收缓冲区大小。现在一切都像魅力一样。我感谢你们给了我激活大发送的想法,否则我就不会找到这个。