背景

背景

尝试确定 FC 链路上是否存在一些间歇性的 DC 间延迟,但只能访问 DCX 8510 的 OID 计数器。由于它是 DWDM 上的 L1 链路,因此服务提供商没有统计数据来衡量任何可能的问题,除了连接测试套件(由于问题是间歇性的,因此总是能发现问题)之外。

当问题发生时,会看到此 OID 的值激增,但尝试找到正确的信息确实很困难。

swfcportrxbados

任何关于此 OID 的更好解释以及指向一些信息以更好地理解 SNMP 输出的帮助都将不胜感激

答案1

背景

swFCPortRxBadOs 跟踪无效有序集的数量,大多数情况下它是物理或虚拟接口的错误,也可以适用于背板。

无论是 Cisco 还是 Broccade,DWDM 或直接 FC 的无效有序集通常是主机或节点性能不佳的结果。DWDM 另一侧的磁盘提示长度超过 6 左右的 RAID 阵列可能会导致虚拟通道超时。这通常意味着您的虚拟通道“卡住”。当交换机端口耗尽所有可用信用时,连接到设备的交换机端口需要保留额外的出站帧,直到设备返回信用以进入缓冲区。当设备在超时内没有响应时,传输交换机将保留帧更长时间,导致缓冲区占用率高。这导致交换机降低向其他传输交换机返回缓冲区信用的速率。然后,这会通过交换机传播(可能是多个交换机,其中设备尝试将帧发送到主机或连接到具有高延迟主机或交换机的交换机的交换机)并影响结构性能。

那么......下一步

可能的罪魁祸首

  1. 物理层故障 - 位于另一侧或您所查看的交换机上的 SFP 出现故障或即将出现故障。

  2. 虚拟通道“卡住” - 解释同上。如果虚拟通道卡住,则不会传输流量或信号,您会看到 er_bad_os 计数器增加。

Brocade 建议在 FOS 中启用 bottleneckmon。当有两秒钟的时间窗口没有任何流量时,它将重置 VC(虚拟通道)。

bottleneckmon –cfgcredittools -intport -recover onLrOnly

当一个或多个信用丢失时,它将开始寻找重置 VC 的窗口。

这是一份关于结构弹性最佳实践的优秀 PDF http://www.brocade.com/downloads/documents/html_product_manuals/NOS_MIB_301/wwhelp/wwhimpl/common/html/wwhelp.htm#context=NOS_MIB_v301_HTML&file=5_sw-mib.06.4.html

使用 portstatushow 查看你的端口,看看是否出现 er_bad_os 591691 无效有序集

它可能会向您保证,您所经历的是一个无效的有序集,因此您可以开始排除信用和缓冲区故障,而这些类型的问题经常发生在这里。

关于缓冲信用的很棒的文章。 http://community.brocade.com/t5/Mainframe-Solutions/Buffer-Credits-and-Frame-Size-calculation-in-FOS-7-1/ba-p/455

相关内容