如何诊断奇怪的网络故障

如何诊断奇怪的网络故障

这很奇怪。我有两个远程网络,我通过互联网在它们之间传输文件。昨天,常规备份作业失败了,所以我开始调查它。几个月来,我一直在这两个网络之间传输文件,没有出现任何问题。

经过几个小时的调试,我得到了这个图表:

网络图

基本上,我无法将任何大文件(> 50MB 左右)从网络 A 传输到网络 B 上两个路由器后面的任何设备。无论我从网络 A 还是网络 B 发起传输都没有关系。它会连接并开始传输,然后几秒钟后(似乎从 5 到 60 秒不等)传输失败。

我可以从网络 A 传输到其他网络,没有任何问题。我甚至可以传输到网络 B 上仅位于 NAT 路由器 1 后面的设备,没有任何问题。小文件工作正常(大多数时候)。较大的文件一开始可以正常工作,然后就会失败。

错误和日志

当我从网络 B 启动 rsync 传输(将文件从 A 发送到 B)时。

...several more identical lines (depends on how soon it fails)...
debug2: channel 0: window 1966080 sent adjust 131072
debug2: channel 0: window 1966080 sent adjust 131072
debug2: channel 0: window 1966080 sent adjust 131072
ssh_dispatch_run_fatal: Connection to XXX.XXX.XXX.XXX port 22: message authentication code incorrect
Sometimes ---> debug3: mux_client_read_packet: read header failed: Broken pipe

当我从网络 A 启动传输时(仍然从 A 发送到 B)

...several more identical lines (depends on how soon it fails)...
debug2: channel 0: rcvd adjust 131072
debug2: channel 0: rcvd adjust 131072
debug3: send packet: type 1
packet_write_wait: Connection to XXX.XXX.XXX.XXX port 22: Broken pipe
rsync: writefd_unbuffered failed to write 4 bytes to socket [sender]: Broken pipe (32)

尝试通过 HTTPS 从网络 A 下载大文件到网络 B 时,传输也会失败。当我运行 curl 时,我得到:

curl: (56) OpenSSL SSL_read: error:1408F119:SSL routines:SSL3_GET_RECORD:decryption failed or bad record mac, errno 0

我发现网络 B 上位于两个路由器后面的多个文件和多台计算机有相同的行为。

我尝试过的方法

  • 网络 B、NAT 路由器 2 上的固件更新:无效果
  • 重新启动两个网络中的所有设备:无影响
  • 尝试通过网络 B 上的 2 个不同的 ISP 进行传输:无效果
  • 将棒球棒放到视线范围内的每个路由器上:仍在决定这一点……

更新

作为一个小更新,我在交互式 SSH 会话期间注意到了同样的问题。如果我运行一个在屏幕上产生大量输出的命令,有时我的 SSH 会话会因无效 MAC 错误而断开连接。

更新 2

NAT 路由器 2 是 Cisco RV320。作为实验,我暂时禁用了防火墙(见下面的屏幕截图)。传输现在可以正常工作,但这也违背了路由器的初衷(它的作用是为我的网络创建一个受保护的内层)。关于如何继续,您有什么想法吗?防火墙设置对我来说有点不透明(它只是一个复选框)。我不确定它在后台到底在做什么。

顺便说一句,我尝试过分别禁用 SPI、阻止 WAN 请求和 DoS,但这些设置都不起作用。只有主防火墙设置(会自动禁用其他设置)才起作用。

思科 rv320 防火墙设置

更新 3

我与思科技术支持人员进行了交谈,他们要求我将路由器直接连接到调制解调器进行测试(绕过 NAT 路由器 1)。在该环境中,传输成功。因此,问题出在两台路由器的组合上。

我启用了 Cisco 路由器的所有可用日志选项,并运行了几次失败的传输,但日志中没有任何内容显示。目前,我不确定如何继续。我可能会更新 NAT 路由器 1 上的固件,只是为了好玩。

答案1

结束语。对我来说,“解决方案”是放弃 RV320,转而使用 DrayTek Vigor 2925。

自从更换路由器以来,我只尝试过几次传输,但其中一次传输的文件很大,耗时近 3 个小时,而且没有任何问题。因此,我可以乐观地说,新路由器已经解决了这个问题。

我希望我能确切地知道思科防火墙为什么会干扰这种流量,因为总的来说,我喜欢这款路由器,但我没有更多的时间来诊断它。感谢所有提供帮助的人。有人想买路由器吗?:)

相关内容