查找与中断相关的 Cisco 路由器/交换机日志

查找与中断相关的 Cisco 路由器/交换机日志

我有一个主路由器,上面连接着几台其他交换机。网络断了,当我控制主路由器时,它变得很慢。重新启动它,但一旦连接其他交换机的接口启动,路由器又变得很慢。逐个重启交换机,一切恢复正常。现在我需要找出哪个交换机是问题的根源,以及问题是什么。

我应该查看哪些日志?我应该查找什么?

答案1

您是否正在将日志记录到系统日志服务器?如果没有,默认情况下,Cisco 设备上的日志缓冲区在重启后将无法保留。

如果您有日志,请查看问题开始时整个网络的消息。任何接口反弹?MAC 抖动?任何设备出现奇怪错误?您是否有一个监控平台可以显示哪个设备首先出现 CPU 峰值?路由表大小?收到的 BGP 前缀?

根据您提供的信息,这有点像将您的汽车送到机械师那里并说“它无法正常工作,您无法打开引擎盖。修理它要花多少钱?”。这是一个非常复杂的话题,根据您的拓扑、硬件、配置和业力,可能会有成千上万个答案。

答案2

重新启动设备来解决问题和重新启动后找到这些问题的根本原因很多时候都是相互独立的。

使用外部系统日志、netflow 和 SNMP 轮询统计数据(CPU、内存和接口统计数据,包括带宽、错误和每秒数据包),您确实有机会。但是,如果出现导致“宕机”的问题,这些统计数据通常无法正常运行。

另一种选择是在重新启动之前收集“show tech-support”或等效命令的输出。

然而,如果没有信息源可供查看并且重新启动后,您只能猜测原因。

我怀疑存在某种 L2 循环,但要证明这一点需要接口的统计数据(特别是数据包/秒)。

相关内容