Nagios、思科交换机、数据包丢失

Nagios、思科交换机、数据包丢失

我使用 Nagios 监控大约 30 台 Cisco 2960 交换机(check_snmp_load、check_snmp_int)。我只检查每台交换机的负载和一两个主干接口。由于设备没有响应,我收到了很多误报。我猜想 SNMP UDP 数据包在某处丢失了,但我无法排除故障。我检查了sh int summary每台交换机,没有关于丢包(IQD 或 OQD)的信息。

同一个 Nagios 实例监控数十个其他设备(Linux 服务器、iDRAC/iLO、SAN 交换机、磁带库等),并且这些设备始终一切正常。

Nagios 和 2960s / 其他设备之间的基础设施连接的唯一区别是 2960s 通过相当旧的 FC 基础设施进行连接。这可能是这些 FC 电缆的问题吗?我如何检查它(无需购买昂贵的网络测量)?我已经使用了防火墙但它没有表现出任何问题。

我还能做什么来解决此问题?

更新:我在 2960s 上的 SNMP 配置非常简单:

#sh run | include snmp
snmp-server community commstr RO

答案1

在开关上你可以启用

deb snmp packet

然后您将看到进出交换机的每个 snmp 数据包。在 nagios 服务器上使用 tcpdump 或 tskark(wireshark)进行网络嗅探。如果您同时监控两者,您应该能够判断问题是否是由数据包丢失引起的。

相关内容