如何诊断间歇性连接问题

如何诊断间歇性连接问题

在工作中,我们遇到了一些间歇性的互联网故障。这表现为几分钟内我们的台式电脑都无法向外部发出任何请求,包括向 IP 地址发出请求。我们责怪我们的 ISP,但在最近的一次中断中,我通过 ssh 连接到我们的一台服务器,发现它能够发出外部 ping 请求。

我们的网络基础设施如下。

VDSL网关
     |
     |
     |
无线路由器 -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  - -
     | | |
     | | |
Active Directory 服务器 服务器 交换机
                                                      | | | | |
                                                      台式电脑

VDSL 网关通过无线路由器上的 PPPoE 配置。

事实

  • 在上次中断期间,上面标记的服务器能够继续发出请求,能够继续 ping google。(应该意味着 VDSL 网关和无线路由器正在运行)
  • 所有台式计算机都失去了连接,但我可以向服务器发出请求,这意味着交换机工作正常。
  • 停电仅持续很短的时间。
  • 无线设备也失去连接,表明路由器的问题出在无线路由器或上游。
  • 所有机器都通过 Active Directory 服务器获取 DNS。但是问题出现在直接 IP 请求上,因此 DNS 应该可以正常工作。
  • 服务器运行的是 CENTOS
  • 台式机由 Windows(主要)、Apple Mac 和 1 个 UBUNTU 安装组成)
  • 当网络瘫痪时,我们将失去 VPN 连接。

我目前没有任何跟踪路由数据。

我应该如何诊断网络上出现的问题?理想情况下,我希望能够从至少我的机器 ubuntu 和 centos 安装中准确监控问题发生的时间(记录 ping 请求?)。当外部 ping 失败时,也许运行跟踪路由。

网络配置为使用 IPv4。网络设置已将无线路由器设置为公共网关。

现行理论 - 服务器通过不同的路径。 - 我很生气,这种情况毫无意义。

需要注意的其他事项是,所有台式机都通过交换机通过无线路由器上的一个以太网插座进行连接。

答案1

您是否检查过服务器上的 dmesg。听起来您的内部网卡可能存在硬件/驱动程序问题,或者可能是连接跟踪表太满之类的问题。

我也见过这种情况,即由于计算机配置错误或恶意软件导致内部网络被淹没。如果交换机上的灯像疯狂的圣诞树一样闪烁 - 这可能是您的问题。

iptraf 确实很有用,可以安装并监控每个接口。从表面上看,您应该监控内部接口并查看活动情况。这可能会为您指明正确的方向。

祝你好运。

相关内容