诊断新网络交换机、新网卡、一台新服务器和两台旧服务器的网络连接问题

诊断新网络交换机、新网卡、一台新服务器和两台旧服务器的网络连接问题

我是网络管理方面的新手,仅使用 Google 已经达到了我自己能做到的极限。我试图寻找类似的问题,但没有找到任何与我目前正在处理的问题类似的问题。

重要背景信息: 我正在两台现有服务器和一台新服务器之间设置 10 千兆网络。我安装了一台新的网络交换机 (Netgear Prosafe XS712T),并在两台旧服务器中安装新网卡(英特尔 X540T2 10Gb 适配器)。新服务器具有相同的网卡。所有服务器都运行某种Linux的(一个运行 debian,一个运行 ubuntu,一个运行 fedora……不是我的错……)。所有这些设置都位于我工作的大学的部门网络之下(存在于其中)。该网络的速度为 1 千兆位。

我正在尝试做的事情: 目标是实现新旧机器之间的高速数据传输,这样我们就可以在新机器上设置一个共享目录,该目录将镜像到旧机器。我们正在处理大约 5-10 GB 的大型数据集。

当前状态: 所有机器都安装了网卡。所有机器都可以访问互联网。所有机器都可以互相 ping 通。所有机器都能够使用 scp 相互传输文件。从 Intel 网站安装了网卡驱动程序 (ixgbe),替换了原生 ixgbe 驱动程序。lsmod 显示所有机器上的驱动程序模块都在运行。

网络交换机在新机器上似乎运行正常*。互联网访问、传输、连接到其他机器等方面没有明显的延迟。对于旧机器,互联网访问有时似乎速度有限/断断续续。

*但是没有高速。使用 scp 将文件从这些机器中的任何一台传输到任何其他机器,网络速度与我安装新交换机和卡之前的速度相匹配。(~65-70MB/s)

问题: 如上所述,自从安装新网卡/交换机以来,连接速度没有变化。连接/ping/传输通常开始时很慢。

例如,从一台旧服务器到另一台旧服务器的 ping 操作...非常缓慢:

mrfox:# ping darjeeling
PING darjeeling.xxxxx (xxx.xx.x.xx) 56(84) bytes of data.
64 bytes from darjeeling.xxxxx (xxx.xx.x.xx): icmp_req=1 ttl=64 time=0.124 ms
64 bytes from darjeeling.xxxxx (xxx.xx.x.xx): icmp_req=2 ttl=64 time=0.116 ms
64 bytes from darjeeling.xxxxx (xxx.xx.x.xx): icmp_req=3 ttl=64 time=0.116 ms
64 bytes from darjeeling.xxxxx (xxx.xx.x.xx): icmp_req=4 ttl=64 time=0.110 ms
^C64 bytes from darjeeling.xxxxx (xxx.xx.x.xx): icmp_req=5 ttl=64 time=0.116 ms

--- darjeeling.xxxxx ping statistics ---
5 packets transmitted, 5 received, 0% packet loss, **time 32034ms**
rtt min/avg/max/mdev = 0.110/0.116/0.124/0.010 ms

同样,但从另一个方向看...一点也不迟缓:

Darjeeling:~$ ping mrfox
PING mrfox 56(84) bytes of data.
64 bytes from mrfox : icmp_req=1 ttl=64 time=0.103 ms
64 bytes from mrfox : icmp_req=2 ttl=64 time=0.097 ms
64 bytes from mrfox : icmp_req=3 ttl=64 time=0.099 ms
64 bytes from mrfox : icmp_req=4 ttl=64 time=0.100 ms
64 bytes from mrfox : icmp_req=5 ttl=64 time=0.078 ms
64 bytes from mrfox : icmp_req=6 ttl=64 time=0.099 ms
64 bytes from mrfox : icmp_req=7 ttl=64 time=0.095 ms
^C
--- mrfox  ping statistics ---
7 packets transmitted, 7 received, 0% packet loss, **time 5998ms**
rtt min/avg/max/mdev = 0.078/0.095/0.103/0.014 ms

从旧服务器 Ping 到新服务器...没有迟缓:

mrfox# ping xxx.xx.x.xxx
---  ping statistics ---
6 packets transmitted, 6 received, 0% packet loss, time 4998ms

当连接到某台特定机器时,Traceroute 的行为会有所不同:

[moonrise]# traceroute darjeeling
traceroute to darjeeling  30 hops max, 60 byte packets
 1  * * *
 2  * * *
 3  * * *
 4  * * *
 5  * * *
etc etc
30  * * *

但连接到任何其他机器时行为正常(我认为?):

[moonrise]# traceroute mrfox
traceroute to mrfox ( ), 30 hops max, 60 byte packets
 1  mrfox. ( )  1.799 ms  1.755 ms  1.673 ms

我的问题: 看起来我们机器之间的连接没有像应有的那样以 10Gb 的速度运行。我认为它只以 1Gb 的速度运行,就像部门的其他网络一样。我可以使用哪些其他命令来测试服务器之间的连接?

如果我是对的,那么如何让机器正确地交互的下一步是什么?

我如何确定导致我观察到的 HTTP 连接间歇性缓慢的原因是什么?

提前感谢大家的回复。如果我遗漏了任何真正重要的数据,我深表歉意。我会关注下面的空间,了解是否有任何关于附加信息/终端输出的请求。

额外的 新机器的 ethtool 报告(旧机器报告相同):

ethtool p8p1
Settings for p8p1:
    Supported ports: [ TP ]
    Supported link modes:   100baseT/Full 
                            1000baseT/Full 
                            10000baseT/Full 
    Supported pause frame use: No
    Supports auto-negotiation: Yes
    Advertised link modes:  100baseT/Full 
                            1000baseT/Full 
                            10000baseT/Full 
    Advertised pause frame use: No
    Advertised auto-negotiation: Yes
    Speed: 10000Mb/s
    Duplex: Full
    Port: Twisted Pair
    PHYAD: 0
    Transceiver: external
    Auto-negotiation: on
    MDI-X: Unknown
    Supports Wake-on: d
    Wake-on: d
    Current message level: 0x00000007 (7)
                   drv probe link
    Link detected: yes

从新服务器到旧服务器的 ping -n 报告:

[ moonrise ]# ping -n 137.82.xx.xx
PING 137.82.x.xx (137.82.xx.xx) 56(84) bytes of data.
64 bytes from 137.82.xx.xx: icmp_seq=1 ttl=64 time=0.205 ms
64 bytes from 137.82.xx.xx: icmp_seq=2 ttl=64 time=0.129 ms
64 bytes from 137.82.xx.xx: icmp_seq=3 ttl=64 time=0.131 ms
64 bytes from 137.82.xx.xx: icmp_seq=4 ttl=64 time=0.136 ms
64 bytes from 137.82.xx.xx: icmp_seq=5 ttl=64 time=0.157 ms
64 bytes from 137.82.xx.xx: icmp_seq=6 ttl=64 time=0.131 ms
^C
--- 137.82.xx.xx ping statistics ---
6 packets transmitted, 6 received, 0% packet loss, time 5000ms
rtt min/avg/max/mdev = 0.129/0.148/0.205/0.028 ms

之前使用 -n 标志且没有 DNS 的 ping 命令运行缓慢:

root@mrfox:# ping -n 137.82.xx.xx
PING 137.82.4.97 (137.82.xx.xx) 56(84) bytes of data.
64 bytes from 137.82.xx.xx: icmp_req=1 ttl=64 time=0.139 ms
64 bytes from 137.82.xx.xx: icmp_req=2 ttl=64 time=0.112 ms
64 bytes from 137.82.xx.xx: icmp_req=3 ttl=64 time=0.111 ms
64 bytes from 137.82.xx.xx: icmp_req=4 ttl=64 time=0.117 ms
64 bytes from 137.82.xx.xx: icmp_req=5 ttl=64 time=0.114 ms
^C
--- 137.82.xx.xx ping statistics ---
5 packets transmitted, 5 received, 0% packet loss, time 3999ms
rtt min/avg/max/mdev = 0.111/0.118/0.139/0.015 ms

答案1

我遇到了和你一样的问题(我们的 Windows 服务器配有 Intel X540T2 10Gb 适配器和 Netgear Prosafe XS712T 交换机)。我联系了 NetGear 和 Intel 支持,他们告诉我这是兼容问题。我很难相信这是真的。我仍在寻找解决方案。如果可以,请告诉我你是否有答案。你可以发送电子邮件至[电子邮件保护]。 谢谢。

相关内容