服务器上线时大量数据包丢失

服务器上线时大量数据包丢失

这是ubuntu 服务器,ssh,写入失败:管道损坏。我要提出一个新问题,因为我不相信该问题仅仅局限于 ssh/ubuntu。

我有两台全新的服务器(Dell PowerEdge R715、R210),上面安装了 Ubuntu Server 10.04 64 位。我运行的是 Cisco 3750 交换机堆栈,配有两台 Juniper SRX240 防火墙/路由器。该设置基本上是单根路由器,我们有 3 个 VLAN:一个内部 VLAN、一个 DMZ VLAN 和一个存储网络 (iSCSI),它们都位于同一个堆栈上。Cisco 堆栈上没有进行第 3 层交换,DMZ 完全与不同交换机上的堆栈隔离。

同一网络(和堆栈)上还有大约 10 台 Dell PoerEdge 服务器,它们已经运行多年,没有出现问题。它们中的大多数运行的是 SLES 10 或 openSUSE,但其中一台运行的是 Ubuntu server 10.04 64 位。我拔掉了这些新服务器上的所有网卡,只留下那些进入我们内部 VLAN 的网卡。

如果我启动其中一台(或两台)机器并让它们静置大约十分钟,我们会开始发现来自网络上其他机器的数据包丢失高达 20%,来自有问题的服务器的数据包丢失高达 40-50%。

有谁知道为什么会发生这种情况,或者我可以做什么来解决问题?如果有必要,我不介意清除这些盒子,因为它们上面还没有任何生产数据。

答案1

我将首先查看交换机日志缓冲区(或者,如果有的话,查看您要将它们导出到的系统日志)。

我以前曾见过多 NIC Linux 机器对 ARP 做出不恰当响应的问题(如“不在预期接口上”),甚至刀片服务器机箱中的刀片也存在更多问题,因为有多个 VLAN 连接到交换机,但没有(有效的)方法将 VLAN 强加到实际的刀片交换机上。这应该在日志中显示为与 MAC 相关的投诉。

第二步,如果启用 arp_filter,情况会变得更好吗?全部新服务器上的接口?

答案2

我遇到过类似的问题,这是由于多个虚拟机配置了相同的 MAC 地址所致。只需生成一个新的 MAC 地址即可解决问题。

答案3

我遇到了同样的问题 - 但也是多台虚拟机。原来是我的机器上的防火墙设置。

相关内容