本周我遇到过两次这种情况,我的上行链路提供商不得不禁用我们的链路,因为他们的路由器识别出广播风暴。不幸的是,他们无法提供有关问题根源的更多信息。
找出导致该问题的原因的最佳方法是什么?
我在上行链路提供商和我的网络之间有一个 Vyatta 路由器。运行“tcpdump 广播”并记录它是否是可行的解决方案?
这样,如果这个问题再次发生,我至少可以有一个日志并识别出广播流量更多的IP。
答案1
广播类型不止一种。
第 2 层(网络)广播(到全 1 的 MAC 地址的流量)被 ARP 等协议用来在已经知道其高层地址(通常是 IP)的情况下收集有关如何连接到特定节点的信息。
第 3 层(IP)广播(到子网最高地址的流量)具有完全不同的功能。
如果您的网络提供商受到第 2 层广播流量的影响,我真的怀疑他们的能力水平。
您的网络提供商通常通过 IP(第 3 层)路由器进行连接,该路由器根本不传递第 2 层流量。
唯一值得注意的第三层广播是典型的 Windows 名称服务请求(WINS 等)
此行为可能表明路由器或终端节点(您的计算机和网络提供商)之间的任何其他点存在硬件问题。
答案2
我不熟悉 Vyatta,但可能是发生了一些不必要的 arp(通常在故障转移事件中发生),从而导致此问题。这是在故障转移期间强制 arp 缓存更新的一种非常常见的机制,但可能会导致此类问题,具体取决于广播的积极程度和接收者的敏感程度。
无论如何都值得研究。
答案3
感谢所有回答的人!
经过进一步调查后,似乎 arp 缓存限制被设置为非常低的值,并且它无法容纳我们网络中的所有主机。
将其设置为更大的值后,问题就解决了。