我目前正在尝试解决网络问题,该问题导致延迟峰值长达 200 秒(通常约为 50 秒),并且每次间隔几个小时。
在尝试找出我的混乱网络的哪一部分需要归咎时(超出了这个问题的范围 - 在聊天中讨论了一下这里和这里),我意识到我没有可靠的方法来确认改变是否确实改善了任何事情。
到目前为止,我注意到这种情况的主要方式是[Lag: 15 (??)]
状态栏中显示 irssi,每 5 秒增加一次,并且所有其他连接似乎也受到影响。由于这取决于我的观察,因此这不是一种非常可靠的方法来了解它真正发生的频率。
请注意,仅发送 ICMP ping 即可大概还不够,但这只是我的猜测。这可能是一个“缓冲区膨胀”问题,可能是数据包丢失,可能是某些内核驱动程序有问题,也可能只适用于持久连接。我怀疑这是因为几个月前,当问题开始时,我在后台运行了一个“ping”命令,在延迟峰值期间它没有显示任何异常。这似乎现在已经改变了(ping 不通过),但我仍然希望有更强大的功能。
答案1
我最近回答过一个类似的问题,不过那个帖子已经关闭了。我会在这里重新发布它……
设置全职流量图表应用程序来帮助识别性能问题。
设置流量图表应用程序来监控路由器的接口使用情况可能是调查办公室网络性能不佳的原因的一个合理起点。这通常要求您拥有一个始终在线的系统,您可以在其中设置轮询程序并使其全天候运行。虽然这不是必需的,但如果该系统可以运行 Web 服务器,那么几乎可以从任何地方检查数据。
流量图表应用程序可让您确定需求是否超过供应(用户请求的比特/秒比您的 ISP 提供的多),特定接口是否比平时发送/接收更多的流量,或者延迟和其他性能问题是否与流量无关。它可以帮助确定是否以及何时应该购买更多容量,或者高网络负载是否是偶然事件。它甚至可以识别导致每天甚至每小时同一时间流量激增的定期调度进程。
虽然有很多这样的绘图应用程序,但我在多个平台上使用过的一个是MRTG - 多路由器流量图表。它可以监控任何支持 SNMP 的设备上的流量:我曾用它来监控大型骨干思科路由器、48+ 端口企业交换机、Linksys 路由器,甚至电缆和 DSL 调制解调器。我建议任何网络管理员都安装此应用程序或类似的应用程序,以便随时了解网络使用模式。
虽然安装过程中涉及一点学习曲线,但一旦配置完成,其数据就不需要高度的技术专业知识来解释,并且配置完成后不会带来额外的管理负担,因为其日志文件的大小不会增加。
答案2
smokeping 是一种测量延迟的方法。使用 mrtg 和 smokeping 或许可以解决这个问题。