所有普罗米修斯警报和警告的着陆点

所有普罗米修斯警报和警告的着陆点

我感兴趣的是,是否有类似的工具可以将所有 Prometheus 触发的警报保存在仪表板等单一位置,从那里我也可以链接一些票务(jira)工具等。所以如果我有 50000+ 台 ubuntu 服务器,它将在一个地方观察从该节点触发的警报并创建票证。因此我可以进行进一步的检查。比如

1-> 站点 1 的 ICMP 丢失率较高 2-> 站点 3 上的节点丢失了 ICMP 连接 3-> 站点 5 上的节点 xx 的 mongo 服务处于致命状态

答案1

是的,电讯报涌入格拉法纳

简而言之,可以配置 Telegraf(一个用 Go 编写的小型代理)来监视您的关键服务,并将指标发送到 InfluxData。InfluxData OSS 是一个开源数据库,您可以在基础架构中运行它来存储这些数据。然后,您可以使用 Grafana 提供一个显示所有主机状态的仪表板。

InfluxData 还提供云服务,当发生不良事件时,可以通过 Slack、PagerDuty、短信或电子邮件向您发出警报。

另一个选择是纳吉奥斯这是一个备受好评的网络监控系统。

相关内容