我们在 Cisco SG350 交换机网络上遇到了一个奇怪的问题,我无法弄清楚。我们认为这可能与 STP 有关,但已验证了所有正常问题点(即正确的端口显示为 Root/SmartPort 已禁用/等等)
网络图如下: Cisco SG-250 网络图
如您所见,我们有 5 台 Cisco SG350 交换机,除交换机 243 外,所有交换机均采用并行菊花链连接。所有这些交换机都连接到 TRUNK 端口,并且都配置了 3 个 VLAN。我们看到的问题是,在一天中(间歇性),流量会在 242 和/或 243 交换机上下降约 30-60 秒。
当我们调查日志时,我们可以验证 a) 交换机尚未重新启动,b) 连接丢失,c) 某些端口似乎在一段时间内(通常为 30-60 秒)处于 STP 阻塞状态。
例如,今天早些时候(10 月 21 日 23:30 左右,格林威治标准时间),sw242 离线了大约 30 秒。sw242 上的日志仅显示 gi17 正在启动/关闭,我们认为这无关紧要,因为 gi17 是闭路电视摄像机。sw243 上的日志没有显示任何变电站(尽管此交换机上的设备已关闭,但上游 sw241 交换机没有),上游 sw241 交换机日志显示 ge24 STP 阻塞和 gi25 STP 阻塞(这是已关闭的 sw242/243 交换机)。
看起来由于某种原因,sw241 导致 ge24 和 ge25(两个下游交换机)定期进行 STP 阻塞,但我无法弄清楚原因。
我已经发布了每个交换机的 TSR/CONFIG 副本,如果需要,我可以提供日志,但我们已经对这个问题进行了数周的故障排除,但似乎无法查明原因。今天,我们升级了所有交换机的固件,并从头开始重建了 244、243、242 的配置。我们没有重建 251 或 241,因为它们似乎不是导致问题的原因(我们可以说),而且由于业务仍在营业,因此关闭整个网络并不有利。
非常感谢任何帮助!!