笔记:我还在另一台服务器上运行 Nagios,用于报告带宽警告和启动/关闭状态。没有一个交换机会因此发出警报,只有 Grafana 会发出警报。
Grafana 版本1.14.1
我每分钟都会收到所有交换机报告故障的警报。
仪表板的指标部分是:
up{instance="192.168.20.20",job="snmp"}
<--- 对于所有被轮询的 12 个开关都一样
在报告的这些“中断”期间,我能够登录交换机。没有其他服务显示中断(例如连接到这些交换机的服务器)。我还没有看到过这样的事情,我正在试图弄清楚如何排除故障。如果实际上没有问题,是什么导致了这种误报?
Grafana 在 Docker 容器中运行,我似乎找不到任何/var/log/grafana/grafana.log.*
与交换机相关的内容。
关于我可以在哪里收集一些信息来调试这个问题,您有什么想法吗?
答案1
Grafana 只是一个可视化工具。正如你所见,它做得非常好。
两件事情 :
可能是你的数据源有问题,检查一下是否有实际数据。
如果您使用脚本/守护程序抓取指标,那么也请检查一下。