Alcatel-Lucent OmniSwitch 9600 上的 ping 时间过长且数据包丢失

Alcatel-Lucent OmniSwitch 9600 上的 ping 时间过长且数据包丢失

我们有 2 台 Alcatel 9600 核心交换机,采用冗余配置,另一层楼有 2 台分布交换机(Alcatel 6850),通过光纤连接到核心交换机。参见下图。

从 10.46.1.5 ping 10.46.1.6 时,会出现数据包丢失。从 10.46.1.5 ping 10.46.1.8 时,会出现数据包丢失。从 10.46.1.5 ping 10.46.1.9 时,会出现数据包丢失。

从 10.46.1.6 ping 10.46.1.5 时出现数据包丢失。从 10.46.1.6 ping 10.46.1.8 时未出现数据包丢失。从 10.46.1.6 ping 10.46.1.9 时未出现数据包丢失。

因此数据包丢失仅发生在来自 10.46.1.5 的 2 条光纤链路和 LAG 连接上。

9600 之间的绿色连接是 LAG。提到的 6850 的蓝色链接是 MM 光纤。我认为 LAG 和 MM 光纤都出现物理损坏的可能性很小。配置没有任何变化,“显示健康”在 10.46.1.5 的范围内(见第二张图片)

数据包丢失的原因可能是什么?我该如何解决?我的第一步是重新启动交换机 10.46.1.5。有没有办法通过 CLI 诊断/检查接口健康状况?

交换机处于工作模式。在重新启动之前,我如何确认工作配置已保存并经过认证,因为我读到如果工作配置文件和认证配置文件不同,交换机将以认证模式启动。

我是 Alcatel 交换机方面的新手,最初并没有参与交换机的安装和配置。如能得到任何帮助,我将不胜感激。

核心和分布交换机 显示 10.46.1.5 的运行状况

答案1

就我个人而言,我发现重启交换机很少能解决问题。尤其是当出现间歇性丢包之类的问题时——根据我的经验,通常具有物理根源的事物。

我建议检查一下你的光纤——我曾经遇到过类似的事情,导致无尽的痛苦,后来我们物理追踪了光纤,发现有人在扭结处拉紧了它。虽然拉得还不够,但足以让它的衰减——因此错误率——显著增加。

电缆追踪可能很麻烦,因此替代方法和诊断证明是沿着地板铺设第二条电缆,并将其插入两个端点。我的第二个方法是检查交换机上的 SFP(小型可插拔模块,有时称为 GBIC)- 它们很小且可更换,是间歇性传输问题的另一个常见来源。

相关内容