问题
所有生产服务器突然无法再访问互联网,而连接到同一 VLAN 和相同 eth0 设置的其他四台服务器可以访问。
图1: System 1
代表目前可以访问互联网的四个系统,而System 2
表示从今天下午开始突然无法访问互联网的系统。
分析
- 系统 1 可以访问系统 2,反之亦然
Default Gateway
(10.10.10.1)也可以从系统 1 和系统 2 ping 通- 系统 1 可以访问互联网
- 系统 2 无法访问互联网
- 所有生产服务器的 Ifconfig
eth0
配置都相同 - 内部 DNS 服务器与其他可以访问互联网的系统相同
/etc/resolve.conf
可以访问位于的 IP 和名称- 可以通过 Switch 访问互联网
- Cisco IOS 上所有 8 个交换机端口的配置均相同
- 从系统 2 到 8.8.8.8 (DNS Google)、google IP 或 google.com 的 Tracepath 挂起
Default Gateway
- 无法访问系统的系统似乎有一个
em1
适配器,而不是eth0
sudo arping -I eth0 ping.tweakers.net
适用于所有 8 个系统- 无法访问互联网的系统之一显示输出,如果
sudo iptables-save
已执行 route -n
所有系统之间的输出相同
追踪路径
[username@hostname ~]$ tracepath google.com
1: 10.10.10.10 (10.10.10.10) 0.222ms pmtu 1500
1: 10.10.10.1 (10.10.10.1) 0.662ms
1: 10.10.10.1 (10.10.10.1) 0.601ms
2: no reply
地址解析协议
系统1: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on em1
系统2: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on eth0
在其中一个无法访问互联网的系统上输出 iptables-save
# Generated by iptables-save vX on Fri Aug 1 10:00:01 2014
*filter
:INPUT ACCEPT [X:Y]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [X:Y]
COMMIT
# Completed on Fri Aug 1 10:00:01 2014
路线-n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.10.10.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
X.Y.0.0 0.0.0.0 255.255.0.0 U Z 0 0 eth0
0.0.0.0 10.10.10.1 0.0.0.0 UG 0 0 0 eth0
目前尚不清楚为何无法从四台生产服务器访问互联网。由于这些服务器正在生产中运行,因此应避免重新启动网络。可以进行哪些进一步的测试来调查该问题?