当前的设置如下:Kubernetes 部署在 AWS 上私有托管区域内的 AWS 实例上(虽然有 NAT 网关,但只能通过 vpn 访问实例),Prometheus 部署为 kubernetes 内的状态集来监控运行状况。
问题是,我该如何设置才能在 Prometheus 本身发生故障时收到警报?我考虑过尝试使用 53 号路线健康检查,但似乎只适用于公共地址。
答案1
通常建议使用另一个元 Prometheus 来监控所有其他 Prometheus 服务器。如果您正在进行联合,则可以免费获得它。