我感兴趣的是,是否有类似的工具可以将所有 Prometheus 触发的警报保存在仪表板等单一位置,从那里我也可以链接一些票务(jira)工具等。所以如果我有 50000+ 台 ubuntu 服务器,它将在一个地方观察从该节点触发的警报并创建票证。因此我可以进行进一步的检查。比如
1-> 站点 1 的 ICMP 丢失率较高 2-> 站点 3 上的节点丢失了 ICMP 连接 3-> 站点 5 上的节点 xx 的 mongo 服务处于致命状态
我感兴趣的是,是否有类似的工具可以将所有 Prometheus 触发的警报保存在仪表板等单一位置,从那里我也可以链接一些票务(jira)工具等。所以如果我有 50000+ 台 ubuntu 服务器,它将在一个地方观察从该节点触发的警报并创建票证。因此我可以进行进一步的检查。比如
1-> 站点 1 的 ICMP 丢失率较高 2-> 站点 3 上的节点丢失了 ICMP 连接 3-> 站点 5 上的节点 xx 的 mongo 服务处于致命状态