以太网链路持续中断(CentOS 5.5/Dell 2950)

以太网链路持续中断(CentOS 5.5/Dell 2950)

几天前,我的一台备份服务器的内部接口出现故障,从那以后我就无法让它正常工作。在 dmesg 中,我看到:

ADDRCONF(NETDEV_UP): eth0: link is not ready
bnx2: eth0 NIC Copper Link is Up, 1000 Mbps full duplex
ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
bnx2: eth1: using MSI
ADDRCONF(NETDEV_UP): eth1: link is not ready
bnx2: eth1 NIC Copper Link is Up, 1000 Mbps full duplex
ADDRCONF(NETDEV_CHANGE): eth1: link becomes ready
eth0: no IPv6 routers present
bnx2: eth1 NIC Copper Link is Down
eth1: no IPv6 routers present

eth0 像以前一样正常工作,但 eth1 似乎可以连接,然后启动,然后几乎立即断开。第一次访问数据中心时,插入一条新的以太网电缆似乎可以暂时解决问题,但此后它再次出现,现在一直发生。

我试过了:

  • 交换交换机端口(认为这可能是 Cisco 2960 上的死端口或即将报废的端口)
  • 换了一条新电缆,但仍然不起作用,并且两条电缆在我的测试笔记本电脑上都能正常工作。

这可能是软件问题吗?还有其他想法吗?

编辑:更多信息

我的 /etc/sysconfig/network-scripts/ifcfg-eth1 如下所示:

# Broadcom Corporation NetXtreme II BCM5708 Gigabit Ethernet
DEVICE=eth1
HWADDR=00:22:19:**:**:**
DHCP_HOSTNAME=******.*******.COM
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.0.117
NETMASK=255.255.255.0
#ETHTOOL_OPTS="autoneg on"

(为了进行测试,我已注释掉 ETHTOOL_OPTS="autoneg on")

更新:我在机架中有一个测试交换机(消费级千兆 Netgear),我们将其用于内部 DRAC 网络管理网络。将其插入本地交换机,然后插入服务器,结果如下:

eth1: no IPv6 routers present
bnx2: eth1 NIC Copper Link is Up, 100 Mbps full duplex, receive & transmit flow control ON

它不是千兆位,但似乎运行良好。(此时不关心网络速度)。但是我该如何调试这样的问题,该服务器与我们拥有的其他 20 台 Poweredge 2950 没有什么不同,所有服务器都具有相同的配置并且仍然正常工作。我唯一一次看到这样的问题是将 DRAC 卡连接到 Cisco 2950(它们也拒绝自动协商)。

这可能是由于 NIC 出现故障,现在无法正确自动协商,还是我应该检查系统本身是否有什么东西导致其混乱?

答案1

谢谢你的信息。你似乎已经完成了布线和交换机端口交换,这将消除所有物理元素,除非 NIC 本身有故障。

如果您已经尝试过在两端以ethtool10full、100full 等硬连线链路,并且没有流量控制或自动协商,那么就没有太多其他可以尝试的了。

我想到两件事:

购买 USB NIC 并将其连接到交换机(它们的价格为一磅,另加运费USB 网卡(真的!)使用 0.5 米 USB 延长器,这样它就可以干净地安装在机架上)。您只能从中获得 100Mbps,但如果您的 NIC 已经放弃,这是一个很好的故障转移。他们使用 Pegasus 驱动程序并在 Debian 和 Ubuntu 上开箱即用,如果这有帮助的话。

其次,ethtool如果尚未安装,请安装并运行“ethtool -S eth1”以获取完整的统计报告。

如果没有其他错误并且您无法获得更多调试信息,我会坚持使用 USB NIC 并将其归结为故障 NIC。

相关内容