这个案例有点难以理解,所以我决定在这里问一下,看看是否有人可以猜测一下我将要描述的问题的根本原因。
我公司有2个主交换机,分别是:
- HPE ProCurve 1800-24G 交换机(J9028B)
- D-Link DGS-1016D
这两个交换机使用一条 Cat6 UTP 电缆相互连接。它们几乎满负荷运行,但工作正常。我们的网络中还有其他几个非托管交换机(大约 2 或 3 个),它们将通信分发/重复到/来自上述 2 个主交换机。
直到 2 个月前,我们一直使用 ISP 提供的劣质 DSL 调制解调器进行 DSL 连接,该 DSL 调制解调器连接到其中一个主交换机 (D-Link DGS-1016D),除了互联网速度天生就很差之外,其他一切都运行良好。大约 2 个月前,我们获得了光纤互联网连接,并从 ISP 获得了光纤网关。光纤网关的速度为 1Gbps,据说是一流的(当然,根据 ISP 的说法)。DSL 调制解调器已从网络中移除,取而代之的是光纤网关,IP 和交换机中的位置相同。
奇怪的部分来了……我注意到的第一个问题是,当我通过其 Web 界面登录此光纤网关时,Web 界面会变得无响应,开始丢失数据包,互联网会在大约 2 或 3 分钟后掉线 - 网关会自行软重启 - 每次我登录时。奇怪的是,当我登录同一设备而它没有连接到我们的网络交换机(使用单个隔离连接的笔记本电脑网关)时,一切都正常。主页加载正常,没有数据包丢失,没有连接中断或重启。
经过一番调整,我发现,至少在某种程度上,这个问题是由网关的主页引起的。我不确定它的作用是什么,它显示了一个网络拓扑的小图,并给出了连接到 LAN 的设备数量(至少偏离了 60%)。我得出这个结论的原因是,我在浏览器中设置了一个 JS 脚本,使用坦普尔猴子,登录后立即将浏览器重定向到网关的另一个页面。这样挂起的问题就永久解决了,我想“好吧,去他妈的,一切都很好“,直到大约一个月前,事情变得更加奇怪。
现在几乎每天,每天多次,网关最终的丢包率将达到 60+%。这是我目前遇到的大问题,我不知道网关的问题严重程度如何,但还有一些其他信息可能有用:数据包丢失同时发生在 LAN 和 WAN 端,并且在 WAN 端,ping 请求由网关“直接”处理,我们没有任何自己的网络设备 - 光纤电缆直接连接到网关,网关又连接到其中一个交换机。
最初几次,我先对网关进行电源循环,然后对交换机进行电源循环,然后有一天,我注意到了迄今为止最奇怪的事情:当网关开始丢弃数据包时,临时解决方案很简单,只需拔下连接 2 个主交换机的 cat6 UTP 电缆几秒钟,然后重新插入即可。此后,网关将正常运行几个小时,最多 3 个小时,然后又回到相同的问题行为。就好像网关超载了,而使用 10 年的 DSL 调制解调器在相同的网络配置下却没有超载。
目前我有几个理论需要验证:
- 问题出在我们的交换机(之一)上。我还没有测试这个的原因是我手头没有交换机,必须买一个。这仍然不能解释旧的 DSL 调制解调器没有问题的事实;
- 问题出在网关本身;需要购买一个合适的路由器/网关来测试这一点;
- 我想我忘记了我的另一个理论......
我尝试让 ISP 更换另一个网关(不同型号),但他们拒绝了,因为这个问题只有在连接到我们的网络时才会出现。这些网关不是专业级的,但与旧的家用 DSL 调制解调器相比,它们有多糟糕呢?!
好吧,这就是我面临的问题。有什么想法吗?有什么建议吗?
提前致谢。
答案1
如果您对网络(使用托管交换机)没有更多的了解,那么这只是猜测。您已经将 ISP 网关定位为问题的根源。软重启本身就是证据。很有可能它只是仅有的问题。
请与 ISP 联系
- 有固件升级,提高了稳定性
- 路由器的内存足以满足您的网络需求 - 如果可能的话,请监控一段时间
- 你可以更换路由器,甚至可能是同一类型的路由器 - 你的设备可能有问题
- 有一些选择可以让你获得一个不错的路由器,并通过 WAN 连接运行它
ISP 支持人员可能知道问题所在,但装傻,或者您的设备/固件版本/配置有问题。关键是 ISP 网关是 ISP 的责任,您需要它才能正常工作。