我想使用单个 Grafana 实例来监控 Prometheus 提供的多个 Kubernetes 集群(pod 资源消耗、rabbitmq 队列信息)。我有两个 Kubernetes 集群 - 一个用于监控和常见工作负载,另一个用于特定(敏感)工作负载。
基本信息
- 我不想使用 Prometheus(在集群 2 中)作为 Grafana 中的数据源(使用联合),因为我想最大程度地保持集群 2 的隔离度(禁止进入或其他公共端点)
- 我可以使用 Grafana 中的两个数据源(集群 1、集群 2)
- 我已经发现thanos.io但我不确定这是否是正确的道路
你能帮我设计解决方案吗?
答案1
您说得对;您可以将 Thanos.io 用于您的用例,特别是 Thanos 接收器。它们旨在通过仅出口连接收集指标。
一般思路是在 Cluster 1 中安装 Thanos Receiver,然后在 Cluster 2 中配置 Prometheus 以使用该remote_write
功能将抓取的指标发送到 Cluster 1 中的 Thanos Receiver。然后,设置 Thanos Querier 以访问数据并在 Grafana 中进行可视化。
你可以查看 KillerKoda 的教程进行练习,因为它们Thanos 文档中推荐。