基本组播网络性能问题

基本组播网络性能问题

我一直在使用 29west 的 mtools 软件包中的 mpong 来了解各种 Cisco 交换机之间的多播延迟的基本概念:1Gb 2960G、10Gb 4900M 和 10Gb Nexus N5548P。1Gb 仅用于比较。

我对每台交换机上大约 400 次 mpong 的运行结果如下(向接收器发送 65536 条类似“ping”的消息,然后接收器返回 - 全部通过多播)。数字是以微秒为单位测量的延迟。

Switch           Average      StdDev      Min         Max
2960 (1Gb)       109.68463    0.092816    109.4328    109.9464
4900M (10Gb)     705.52359    1.607976    703.7693    722.1514
NX 5548(10Gb)    58.563774    0.328242    57.77603    59.32207

4900M 的结果非常令人惊讶。我尝试了单播 ping,发现 4900 的延迟比 N5548P 高约 10us(平均 73us vs 64us)。Iperf(没有尝试调整)显示两个 10Gb 交换机都为我提供了 9.4Gbps 的线路速度。

两台机器连接到同一台交换机,我们没有进行任何多播路由。操作系统是 RHEL 6。10Gb NIC 是 HP 10GbE PCI-E G2 双端口 NIC(我相信它们是重新命名的 Mellanox 卡)。

4900 交换机用于一个具有严格访问控制的项目,因此我正在等待批准,然后才能访问它并检查配置。另外两个我有完全的配置权限。

我查看了思科文档[1],其中详细介绍了 NX-OS 和 IOS 在多播方面的差异,因此我有一些想法想尝试,但这不是我擅长的领域。

有谁知道一旦我能够访问交换机,我应该查看什么?

[1]http://docwiki.cisco.com/wiki/Cisco_NX-OS/IOS_Multicast_Comparison

编辑(1月12日 09:45 GMT):

4900M 已启用 IGMP 侦听。我在交换机或服务器上的计数器上没有看到数据包丢失或错误。

我查看了 CPU 使用率,发送 ping 消息时 CPU 使用率似乎达到 94%。75% 是“Cat4k Mgmt LoPri”,6% 是“IP 输入”,3% 是“Cat4k Mgmt HiPri”

编辑2(1月12日 10:00 GMT):

一旦我停止消息,CPU 使用率就会下降到 8%。

编辑3(1月13日 09:45 GMT):

问题与第 3 层有关。如果我禁用 VLAN 接口,则延迟会降至 72 微秒。

VLAN 的配置是

VLAN 110
 名称 192.168.110/24-10Ge
结尾

...剪辑...

接口Vlan110
 描述 10G 测试 Vlan
 IP地址 192.168.110.4 255.255.255.0
 ip pim 稀疏模式
结尾

答案1

戴夫,你的第三层预测可能是正确的。

尝试这两个文档: http://www.cisco.com/en/US/products/hw/switches/ps663/products_tech_note09186a00804cef15.shtml

您是否已启用 IP 多播路由?禁用它。

启用 igmp 监听,启用 mrouter - 解决方案 3 (http://www.cisco.com/en/US/products/hw/switches/ps708/products_tech_note09186a008059a9df.shtml#solu1) 开关。

西森(多伦多)

答案2

4900 是否启用了“ip mcast cef”(或实际上的“使用 cef 进行多播转发”命令)?某些平台默认使用进程交换进行多播转发(某些平台,某些 IOS 版本将使用 CEF 进行多播,因此会出现有趣的故障场景...),这将导致极端的负载和延迟。

答案3

解决了。​​问题在于没有配置 PIM RP。

相关内容