Netdata、prometheus 和 grafana——为什么推荐这个?

Netdata、prometheus 和 grafana——为什么推荐这个?

目前我为我们的服务器设置了监控服务。我找到了一些文章,建议使用:Netdata, prometheus and grafana

所以我想知道使用这三种方法有什么好处。有人能向我解释一下,如果 netdata 似乎可以做与这两者相同的事情,为什么推荐使用 prometheus 和 grafana 吗?

即使在 netdata-documentations 中,也有一篇关于此设置的文章:https://learn.netdata.cloud/docs/agent/backends/prometheus/#filtering-metrics-sent-to-prometheus

这个星座有什么好处呢?

答案1

总之,Grafana 将显示 Prometheus 从 netdata 收集的指标。

推出这样的堆栈没有任何好处,除非 Prometheus 具有扩展能力,这使得它无处不在,所以如果你已经有netdata 并且想要使您的堆栈现代化,您可以将它与 Prometheus 一起使用。

如果您是从头开始,我建议您坚持使用 Grafana + Prometheus + Prometheus 的节点导出器。这将为您提供大致相同的指标,但具有“原子性”,因为每个指标都只做好一件事,并且每个组件都是独立的,因此您可以管理每个组件而不会(过度)影响其他组件。

答案2

我建议,如果您刚刚起步,那么 Netdata Agent + Netdata Cloud 的组合可以满足您的需求。

您可以在要监控的每台计算机上安装 Netdata Agent,并使用 Netdata Cloud 作为统一的管理平台,以“集中式”方式查看整个基础设施。请注意,数据存储在每个节点的本地,并通过云传输到您的浏览器直接地

如果 Netdata 可以监控您需要的任何内容,那么我没有必要花时间设置 Prometheus 和 grafana,因为 Netdata 可以为您提供开箱即用的一切(数据收集、警报、图表)。

如果您想要长期存档指标(例如 6 个月以上),则可以启用导出功能。在这种情况下,您可以每 60 秒导出一次以节省空间,而 Netdata 将在短期内保留每秒指标。

免责声明:我在 Netdata 工作

答案3

现在,您可以删除 Prometheus,并使用以下方式直接从 Netdata 软管查询/可视化指标Grafana 的全新官方 Netdata 插件

答案4

我已经使用 Netdata 几年了,非常喜欢它。我在这里解释一下我的理由:

  • Netdata 快速发展与其他监控工具相比,Netdata 正在积极发展,每次我访问他们的网站时,都会看到很多变化。其他监控工具则不会出现这种情况。以 Prometheus 或 Zabbix 为例。它们的发布周期非常长,而且很少添加新功能。
  • 华丽的仪表板。没有其他监控工具能像 netdata 一样为您提供流畅美观的仪表板。它速度快、信息丰富、功能丰富。它们为一些图表添加信息,以教您这些指标是什么以及如何处理它们。
  • 实时监控。没有其他监控工具可以为您提供实时监控数据。大多数监控工具都不是为实时监控而设计的。
  • 综合指标。与prometheus导出器相比,netdata具有用于监控不同技术的插件。
  • 机器学习功能。Netdata 将根据您的资源指标数据进行异常检测,并为您提供有关基础设施的见解。您在其他任何地方都找不到如此简单且免费的此功能。
  • 日志指标提取:Netdata 读取日志文件(例如 Web 日志或 systemd 日志)并从中提取有用的指标,这在大多数情况下可以解决您对日志管理系统的需求!

Netdata 的唯一问题是,它是一个安装在单个主机上的全功能监控代理。在监控中,我们需要从不同的主机收集指标,并将它们集中存储在某个地方,以备我们以后需要它们或偶尔使用。Netdata 需要其他工具来发送数据,并且该工具会将历史指标存储更长时间,以便在主机发生故障或硬盘出现故障时我们不会丢失数据。prometheus(或 Netdata Cloud)可以解决这一需求。我们可以要求 prometheus 从我们所有的 netdata 实例中提取指标并集中存储它们。然后我们使用 Grafana 在漂亮的仪表板中查看指标。我认为,如果其他工具可以支持 OpenMetric 标准,我们可以使用它们代替 prometheus 进行存储。

相关内容