这主要发生在我升级 Jetson AGX 盒子时。我想跑
sudo apt-get update
经过几次下载后,网络停止工作。下载失败后,它最终会重新启动。这可能需要一分钟。
当这种情况发生时,整个网络将在这段时间内关闭。否则所有计算机均正常工作(继续播放视频,可以继续编译等)
关于 @Gilles 的想法,他发表了评论这个帖子,我运行 tcpdump 看看发生了什么。每当网络在网络上收到 STP 消息时就会出现该问题。
09:00:26.118679 IP _gateway.42102 > panelve.ssh: Flags [.], ack 37541, win 1944, options [nop,nop,TS val 3025122625 ecr 604916587], length 0
09:00:26.118726 IP _gateway.42102 > panelve.ssh: Flags [.], ack 40093, win 1944, options [nop,nop,TS val 3025122625 ecr 604916587], length 0
09:00:26.124774 IP panelve.ssh > _gateway.42102: Flags [P.], seq 40093:40241, ack 512, win 1446, options [nop,nop,TS val 604916589 ecr 3025122625], length 148
09:00:26.166140 IP _gateway.42102 > panelve.ssh: Flags [.], ack 40241, win 1944, options [nop,nop,TS val 3025122673 ecr 604916589], length 0
09:00:27.738519 STP 802.1d, Config, Flags [Topology change], bridge-id 8000.a4:b2:39:95:9c:47.800c, length 35
09:00:29.738117 STP 802.1d, Config, Flags [Topology change], bridge-id 8000.a4:b2:39:95:9c:47.800c, length 35
09:00:30.193762 IP 192.168.1.2.39763 > 239.255.255.250.1900: UDP, length 146
正如我们所看到的,TCP 数据包按预期流动,直到 09:00:26.166140。然后暂停,我们收到 STP 802.1d 事件。在这种特定情况下,它太长并且最终失败。现在,在该网络上,我每隔几秒就会看到许多 STP 事件。该办公室发生停电,所有计算机都瘫痪了。我尝试重新启动网络交换机,但它继续生成 STP 消息。
还可以做些什么来解决这个问题?这是硬件问题还是我需要尝试再次重置交换机?我是否需要彻底关闭所有内容,然后重新启动所有内容?我以前从未见过这样的错误,所以我不太确定解决这个问题的方法是什么......
PS请注意,只要我不尝试下载,网络功能就很好大的文件(即十分之一 Mb)。所以我知道防火墙和连接仍然如预期的那样。此外,在停电之前它运行得很好(而且速度很快)。
答案1
因此,对于为什么生成该消息,我确实没有一个好的答案STP
,但我找到了罪魁祸首:我有一个完全托管的思科交换机,并且它是在整个网络上生成这些消息的人。当我用非托管交换机替换该交换机后,一切都开始正常工作,并且速度非常快,正如预期的那样。
可能有一种方法可以设置开关以避免这些消息,如果您知道的话,我很乐意倾听,尽管我可能不会花时间进行测试。但对于遇到同样问题的其他人来说可能很有用。请注意,我使用两个这样的开关进行了测试,因此我非常确定这些STP
消息是这些开关方案的一部分。它可能需要每个系统正确回答显示查询或类似内容以正确整合网络。
因此,如果您看到这些消息,您可能需要更换为更简单的开关。
为了查看问题是否已解决,我使用了以下命令:
sudo tcpdump -n | grep ' STP '
当我使用思科交换机时,这种情况至少每隔一秒就会发生一次。如果没有思科交换机,这一切都不会发生。