我遇到了随机网络速度变慢的问题,我正在尝试找出如何对其进行诊断。
我们的系统由 4 个 NVIDIA AGX Xaviers 和 1 个 NVIDIA AGX Orin 组成,连接到 GigaBlox 千兆交换机(我们尝试过其他交换机,但仍然有问题)。Xaviers 运行的是 Ubuntu 18.04,Orin 运行的是 Ubuntu 20.04。大部分流量都是从 Xaviers 流向 Orin 的数据。
问题是,随机地,其中一个 Xaviers 网络连接会变得非常慢。然后对它执行 ping 操作将延迟最多 0.5 秒。3 个 Xaviers 可以正常运行。它每次只影响一个系统。它通常会在几分钟后消失,网络速度会恢复正常,但我们需要首先防止这种情况发生。
基本上,我的问题是:我该如何开始诊断导致这种情况的原因?是否有可以运行的某些测试?目前我们不确定这是由驱动程序问题还是硬件问题引起的。
先感谢您。
答案1
听起来可能是访问控制列表和 IP 片段。您的组织管理员应该创建 ACL 规则流程图。QOS。硬件不足。我 14 年前从事过大型网络工作,现在退休了,所以请谨慎对待我所说的话。