prometheus

无法启动 Prometheus 节点导出器
prometheus

无法启动 Prometheus 节点导出器

我已经通过从中提取存档安装了 Prometheus官方网站,创建用户 prometheus 和 systemd 单元文件。它已成功启动。但现在当我尝试对节点导出器执行相同操作时,我遇到了一个错误:Failed to start Prometheus Node Exporter.我从指导 systemctl status node_exporter 无法启动 Prometheus Node Exporter。 tail /var/log/syslog 显示: Feb 23 10:11:32 box systemd[2562]: node_exporter....

Admin

在与 Apache 相同的 Docker 容器中运行节点 apache-exporter
prometheus

在与 Apache 相同的 Docker 容器中运行节点 apache-exporter

我正在运行节点apache-exporter(https://github.com/Lusitaniae/apache_exporter) 与 Apache 本身位于同一个 Docker 容器中(从 httpd 映像构建)。 (因此,我能够通过一个 Dockerfile 和一个 docker-compose 将服务直接分发到容器中,就像使用两个 Dockerfile 一样,并将两个容器组合在一个 docker-compose 文件中。) (apache-exporter和 Apache 服务器) 运行,我可以apache-up在 Prometheus/Gra...

Admin

Prometheus Blackbox Exporter TCP 探测返回值为 0,即使端口已打开(Iperf3 服务器)
prometheus

Prometheus Blackbox Exporter TCP 探测返回值为 0,即使端口已打开(Iperf3 服务器)

我遇到了一个奇怪的问题,过去几天我一直在研究它。 设置 我有一个在 Docker 中运行的 Iperf3 服务器,运行于以下内部地址和端口:10.10.2.2:5201 我还在 Docker 中运行 Prometheus 和 Grafana,以监控不同的服务。 一切正常,包括用于 HTTP 和 HTTPS 的 Prometheus Endpoint 导出器和 Prometheus Blackbox 导出器。 但是,我还想使用带有 Blackbox 导出器的简单 TCP 探测器监控此 Iperf3 服务器。 以下是我为 Prometheus 和 Blackbo...

Admin

Prometheus使用promtool导入旧数据出错
prometheus

Prometheus使用promtool导入旧数据出错

跟进其他人面临的类似问题: promtool tsdb create-blocks-from openmetrics 在 Prometheus 中不显示任何数据 我遇到了类似的问题。我有一个抓取 API 端点,Prometheus 会按照预期抓取该端点: my_custom_metric{metric_name="group.1"} 10 1713416400000 我的 prometheus 抓取并正确显示,直到我尝试导入数据。我遵循了 @thoro 的评论并确保数据采用 unix 时间戳。 # HELP my_custom_metric Example ...

Admin

Prometheus默认存储保留时间
prometheus

Prometheus默认存储保留时间

我像附加的那样将 Prometheus (v.2.51.2) 作为容器启动,并期望标志“storage.tsdb.retention.time”默认设置为“15d”,但它的默认值是“0s”,意思是无限。这是什么原因造成的? docker run -d \ --name=prometheus \ -p 9090:9090 \ -v ./prometheus.yml:/etc/prometheus/prometheus.yml \ -v prometheus-data:/prometheus \ prom/prometheus ...

Admin

我们如何配置 prometheus 服务器以从带有 Istio sidecar 代理的 pod 中抓取指标?
prometheus

我们如何配置 prometheus 服务器以从带有 Istio sidecar 代理的 pod 中抓取指标?

服务 pod 正在使用 Istio sidecar 容器运行,并且启用了 MTLS。我们如何定义服务监视器来从此服务中抓取指标?我们是否需要为此更新 Prometheus 服务器? 我的 Pod 监视器如下所示: apiVersion: monitoring.coreos.com/v1 kind: PodMonitor metadata: name: mymonitor labels: release: podwithistiosidecar spec: selector: matchLabels: app: podw...

Admin

kubelet_volume_* 指标未显示所有 PVC
prometheus

kubelet_volume_* 指标未显示所有 PVC

我使用 Prometheus 来监控我的 Kubernetes 集群。我有 42 个 PVC 绑定到 42 个 PV。出于某种原因,kubelet_volume_*只返回其中 29 个的信息。我到处找,但找不到指标为什么会这样。 kubelet_volume_stats_capacity_bytes{endpoint="https-metrics", instance="192.168.***.***:10250", job="kubelet", metrics_path="/metrics", namespace="prod-dk", node="ip-1...

Admin

使用 Prometheus 为 Grafana 仪表板配置 Zabbix Exporter 时遇到问题
prometheus

使用 Prometheus 为 Grafana 仪表板配置 Zabbix Exporter 时遇到问题

我目前正在尝试设置 Zabbix Exporter,以将 Zabbix 指标提取到 Prometheus 中,以便在 Grafana 仪表板中进行可视化。我的目标是利用 Grafana 的功能来创建富有洞察力的可视化效果,因为我发现在显示特定指标方面存在一些限制,例如数据存储的可用大小相对于总大小。 我成功安装了 Prometheus,它似乎按预期运行。然而,当从 GitHub 集成 Zabbix Exporter 时,尽管正确配置了它并创建了 systemd 单元文件,Prometheus 服务器仍返回以下错误: server returned HTTP ...

Admin

自由/总量,当自由=总量的 10% 时,颜色变为红色
prometheus

自由/总量,当自由=总量的 10% 时,颜色变为红色

我正在使用 Grafana,并尝试将“可用空间/总大小”的值显示为实际值而不是计算值。我想创建一个值映射,以便当可用空间占总大小的 10% 时,颜色变为红色。我不确定这是否可行,但我相信第一部分应该是可能的。 目前,我有以下设置: 我尝试使用转换函数,但它给出了一个奇怪的值,而且似乎没有我需要的选项。我只想看到每个数据存储的两个条形图,而不是四个。我对这整个事情完全是菜鸟,我搞不懂。 我是否应该在 Zabbix 中设置一个显示可用/总计的项目并在 Grafana 中将其可视化,而不是尝试在 Grafana 中找到方法?安装 Prometheus 有帮助吗?...

Admin

启用remote_write后Prometheus CPU消耗
prometheus

启用remote_write后Prometheus CPU消耗

我无法弄清楚为什么启用 remote_write 功能后,我的 Prometheus 实例开始消耗大量 CPU。 我已经从图表 kube-prometheus-stack 版本 40.1.2 部署了 prometheus 和 grafana。除此之外,我们还部署了 Grafana Tempo。我们选择添加对服务图的支持,这需要启用 Prometheus remote_write 功能。启用此功能后,Prometheus 上的 CPU 消耗从约 30m 增加到约 2700m。这是预期的吗?如果是,有人可以解释一下原因吗? 另一方面,如果没有,有人可以指出我应该...

Admin

Docker 中的 Grafana Agent 运行了一个多星期,然后突然停止工作。当我们检查时,数据文件夹不见了
prometheus

Docker 中的 Grafana Agent 运行了一个多星期,然后突然停止工作。当我们检查时,数据文件夹不见了

我们已经使用官方 Docker 映像部署了 Grafana Agent,以将我们的服务器和容器的指标发送到 Grafana Cloud: docker run \ -v /etc/grafana-wal:/etc/agent/data \ -v /etc/grafana-agent.yaml:/etc/agent/agent.yaml \ grafana/agent:latest 这种方法在很多天里都很好用。我们可以看到/etc/grafana-wal文件夹包含信息,并且与容器内文件夹的内容相匹配/etc/代理/数据 问题出现在大约 7-12 ...

Admin

Prometheus/grafana:从“node_uname_info”指标中提取主机名并创建 CPU、内存使用情况 grafana 面板
prometheus

Prometheus/grafana:从“node_uname_info”指标中提取主机名并创建 CPU、内存使用情况 grafana 面板

我使用多个 IP 地址填充了 prometheus.yml -> scrape_configs -> static_configs -> target 部分。prometheus 服务器上没有 DNS 功能,也无法填充主机名(而不是 IP)。 我想使用基于节点名/主机名值的正则表达式创建内存、CPU 使用率特定的 Grafana 面板。它还应该有主机名legands。 由于hostname默认的 node_exporter 指标中没有信息,我正在探索利用node_uname_info具有主机名信息的指标的可能性。 我尝试使用relabel...

Admin

如何使用单个 Grafana 监控多个 Kubernetes 集群?
prometheus

如何使用单个 Grafana 监控多个 Kubernetes 集群?

我想使用单个 Grafana 实例来监控 Prometheus 提供的多个 Kubernetes 集群(pod 资源消耗、rabbitmq 队列信息)。我有两个 Kubernetes 集群 - 一个用于监控和常见工作负载,另一个用于特定(敏感)工作负载。 基本信息 我不想使用 Prometheus(在集群 2 中)作为 Grafana 中的数据源(使用联合),因为我想最大程度地保持集群 2 的隔离度(禁止进入或其他公共端点) 我可以使用 Grafana 中的两个数据源(集群 1、集群 2) 我已经发现thanos.io但我不确定这是否是正确的道路 你能帮...

Admin

使用 Prometheus 进行 Kubernetes 监控
prometheus

使用 Prometheus 进行 Kubernetes 监控

我在这里需要一点帮助。我有一个正在运行的 Kubernetes 集群,还有一台专用的机器用于监控,上面运行着 Prometheus。我已经运行了节点导出器并抓取了机器级指标,例如 CPU、内存、文件系统等。 但我仍然对如何继续感到困惑。我只是尝试将 Kubernetes 元素集成到 Prometheus 中(我从服务开始)。(基本)抓取配置和服务帐户(令牌)没有太大问题。我的问题如下。 最重要的是:我想知道为什么基本上每个人的首选策略都是在他们想要监控的同一个集群内运行 Prometheus?对我来说,这感觉是一个非常糟糕的主意。我错过了什么?我的意思是,...

Admin

如何使用 Grafana Alertmanager 来制定 Prometheus 规则?
prometheus

如何使用 Grafana Alertmanager 来制定 Prometheus 规则?

该公司决定将所有警报集中在 Grafana(统一警报)上。警报通过 Grafana UI 创建,内部 Grafana Alertmanager 用于将警报路由到联系点。 我想在各种应用中重复使用基于社区的 Prometheus 规则混合。可以使用 Grafana 来做到这一点吗? 换句话说,Grafana 可以理解 Prometheus 规则或接受来自 Prometheus 本身的警报吗?手动将 Prometheus 规则转换为 Grafana 表达式是唯一的方法吗? ...

Admin