生产服务器突然无法再访问互联网

生产服务器突然无法再访问互联网

问题

所有生产服务器突然无法再访问互联网,而连接到同一 VLAN 和相同 eth0 设置的其他四台服务器可以访问。

在此处输入图片描述

图1: System 1代表目前可以访问互联网的四个系统,而System 2表示从今天下午开始突然无法访问互联网的系统。

分析

  • 系统 1 可以访问系统 2,反之亦然
  • Default Gateway(10.10.10.1)也可以从系统 1 和系统 2 ping 通
  • 系统 1 可以访问互联网
  • 系统 2 无法访问互联网
  • 所有生产服务器的 Ifconfigeth0配置都相同
  • 内部 DNS 服务器与其他可以访问互联网的系统相同
  • /etc/resolve.conf可以访问位于的 IP 和名称
  • 可以通过 Switch 访问互联网
  • Cisco IOS 上所有 8 个交换机端口的配置均相同
  • 从系统 2 到 8.8.8.8 (DNS Google)、google IP 或 google.com 的 Tracepath 挂起Default Gateway
  • 无法访问系统的系统似乎有一个em1适配器,而不是eth0
  • sudo arping -I eth0 ping.tweakers.net适用于所有 8 个系统
  • 无法访问互联网的系统之一显示输出,如果sudo iptables-save已执行
  • route -n所有系统之间的输出相同

追踪路径

[username@hostname ~]$ tracepath google.com
 1:  10.10.10.10 (10.10.10.10)                                  0.222ms pmtu 1500
 1:  10.10.10.1 (10.10.10.1)                                    0.662ms
 1:  10.10.10.1 (10.10.10.1)                                    0.601ms
 2:  no reply

地址解析协议

系统1: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on em1

系统2: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on eth0

在其中一个无法访问互联网的系统上输出 iptables-save

# Generated by iptables-save vX on Fri Aug  1 10:00:01 2014
*filter
:INPUT ACCEPT [X:Y]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [X:Y]
COMMIT
# Completed on Fri Aug  1 10:00:01 2014

路线-n

Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
10.10.10.0      0.0.0.0         255.255.255.0   U     0      0        0 eth0
X.Y.0.0         0.0.0.0         255.255.0.0     U     Z      0        0 eth0
0.0.0.0         10.10.10.1      0.0.0.0         UG    0      0        0 eth0

目前尚不清楚为何无法从四台生产服务器访问互联网。由于这些服务器正在生产中运行,因此应避免重新启动网络。可以进行哪些进一步的测试来调查该问题?

相关内容