我目前正在运行三个 KVM 主机,它们托管一系列 Linux 和 Windows 虚拟机。
客户机配置为使用 br0 作为网络桥梁。
底层 br0 有两个 NIC,设置成任何时候只有一个处于活动状态,但如果主 NIC 发生故障,另一个 NIC 将启动。
我看到在所有三台机器上(使用 nmon),接口 kvmbr0 和 ens2f0(对中的主 NIC)都显示了大量 iErrors 和 oErrors(在正常运行时间少于 24 小时的机器上,错误数量约为 4300 万)。
我不知道这些错误是否相关,或者我应该如何继续调查该问题。
如果有人知道从哪里开始,我将不胜感激。
答案1
从检查这些命令的输出开始:
ip -s -s link show dev <ifacename>
- 网络接口的通用统计计数器ethtool -S <ifacename>
- NIC 的低级计数器nstat -az
- 网络堆栈的系统指标(检查man nstat
- 您可以实时监控计数器的变化)