我有一个 25 节点的 Cloudera 集群,在所有节点上我都收到了严重警告
Network frame errors account for 0.95 of incoming network packets over the past 15 minute(s) across all monitored network interfaces. Critical threshold: 0.50%
我在网上搜索了一下,发现这与他们正在处理的 NIC 有关,但我无法解决问题,因为我不知道根本原因
以下是 ifconfig 的输出
Link encap:Ethernet HWaddr 00:25:90:eb:c5:a7
inet addr:192.X.X.X Bcast:192.X.X.Y Mask:255.255.255.0
inet6 addr: fe80::225:90ff:feeb:c5a7/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:361764563 errors:503994 dropped:0 overruns:0 frame:503994
TX packets:885327394 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:184606487706 (184.6 GB) TX bytes:859026289443 (859.0 GB)
我所能看到的是 RX 中存在错误,并且帧中的数字相同。
任何帮助都将不胜感激。谢谢
答案1
这些错误最有可能的来源是电缆。首先,我会尝试在服务器和交换机之间使用不同的电缆。此外,检查所有连接器,尝试拔下并重新插入,尝试交换机上不同的端口。