我知道这个问题比较棘手,因为这个问题可能是由很多不同原因引起的。不过,也许您遇到过类似问题,或者有一些提示或技巧,可以告诉我如何成功调试当前设置。
基本上,我们正在运行一个中小型办公网络,当前设置如下:
- 负载均衡器(Draytek Vigor 3300)
- 在负载均衡器内部,我们有 2 个 Cisco 管理交换机
- 负载均衡器连接到 3 条路由,提供与互联网的连接。
问题是,网络(LAN 和外部)时不时会变得非常慢,或者 LAN 正常但外部流量完全停滞。这种情况甚至不会在规定的时间间隔内发生,有时我们几周都没有注意到任何问题。重新启动负载平衡器可以解决问题,直到下次发生这种情况。
现在,我知道如果不实际查看设置,这个问题几乎不可能解决,但是我想也许有人以前遇到过类似的情况,或者知道问题可能是什么。
如果您需要更多信息,请告诉我
答案1
更多数据:
间歇性问题很难解决。你需要做的第一件事就是隔离问题——为此你需要数据:
- 来自所有设备的日志,包括流量日志。
- 所有设备的 CPU、网络吞吐量和数据包丢弃以及内存使用情况。
- 在正常流量期间捕获数据包,然后在出现问题时捕获数据包(如果您可以设法获得一个)。
一旦您获得了所有这些数据,您需要尝试将事件与您收集的数据所发生的事情关联起来。
或者,猜猜看:
另一种方法就是开始更换东西或简化情况。使用这种方法,您可以做出最佳猜测并替换它。您说重新启动负载平衡器似乎可以解决这个问题,有时是 LAN,有时是 WAN。这指向负载平衡器,因此这是一个合乎逻辑的起点。您可以从在用于负载平衡的商品盒(即通用 Linux 服务器)上运行的 HAProxy 中获得很多好处——所以您可以尝试一下。
此外,您可以检查更新或向负载平衡器制造商开具支持票。
答案2
我们在使用 Vigor 时也遇到了问题,我们之前遇到过这个问题,并且一直收到拒绝连接的错误。你运行的是什么固件?最新的固件似乎有帮助。
另一方面,您是否对 Vigor 制定了负载平衡策略?