Munin 聚合图无法正常工作

Munin 聚合图无法正常工作

我知道这个问题之前已在很多论坛上被问过好几次了,但我仍然遇到类似的问题。

单个图表可以正常工作,但聚合图表则不行。我甚至没有得到一个空图表(没有数据的图表)。

所有机器都在 Ubuntu-12.04 m1.medium ec2 实例上运行。Munin 版本是 1.4.6。

我的 munin.conf 看起来像......

[localhost.localdomain]
地址 127.0.0.1
use_node_name 是

[.us-west-1.compute.internal]
地址
use_node_name 是

[.us-west-1.compute.internal]
地址
use_node_name 是

[.us-west-1.compute.internal]
地址
use_node_name 是

[us-west-1.compute.internal;totalcheckpoints]
更新 无
联系人 无

postgres_checkpoints_checkpoints_req.update no  
postgres_checkpoints_checkpoints_req.graph yes  
postgres_checkpoints_checkpoints_req.graph_args --base 1000 -l 0  
postgres_checkpoints_checkpoints_req.cdef 0  
postgres_checkpoints_checkpoints_req.graph_category PG Total Checkpoints  
postgres_checkpoints_checkpoints_req.graph_title Aggregated checkpoints  
postgres_checkpoints_checkpoints_req.graph_vlabel Total Checkpoints  
postgres_checkpoints_checkpoints_req.checkpoints_req_total.label Total checkpoints  
postgres_checkpoints_checkpoints_req.graph_order checkpoints_req_total  
postgres_checkpoints_checkpoints_req.checkpoints_req_total.sum \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req  

我已尝试在 /etc/munin/plugins 中跟踪符号链接:

postgres_checkpoints -> /usr/share/munin/plugins/postgres_checkpoints
postgres_checkpoints_ -> /usr/share/munin/plugins/postgres_checkpoints
postgres_checkpoints__ -> /usr/share/munin/plugins/postgres_checkpoints

作为 munin 用户,遵循 munin 命令运行正常,并且我在输出中没有看到任何明显错误:

sudo su - munin -s /bin/bash
/usr/share/munin/munin-update --debug --nofork
/usr/share/munin/munin-graph --debug --nofork --nolazy
/usr/share/munin/munin-html --debug

telnet 返回插件 postgres_checkpoints 的正确信息:

munin@hostname:~$ telnet 4949
尝试...
连接到。
转义符为“^]”。
# munin node at internal-ip-of-munin-node.us-west-1.compute.internal
config postgres_checkpoints
graph_title PostgreSQL 检查点
graph_vlabel 检查点/分钟
graph_category PostgreSQL
graph_info 每分钟检查点数
graph_args --base 1000
graph_period 分钟 checkpoints_timed.label 定时检查点
checkpoints_timed.info 超时启动的检查点
checkpoints_timed.type DERIVE
checkpoints_timed.draw LINE1
checkpoints_req.label 请求的
检查点
checkpoints_req.info 按请求启动的检查点
checkpoints_req.type DERIVE
checkpoints_req.draw STACK

获取 postgres_checkpoints
checkpoints_timed.value 2860
checkpoints_req.value
37.
退出

munin-master 和 munin-node 上的日志未显示任何明显错误。还验证了所有主机名都是正确的 fqdn。

知道我遗漏了什么吗?

我检查了很多论坛和链接。但是 serverfault 不允许我粘贴我引用的两个以上链接:
1.http://munin-monitoring.org/wiki/aggregate_examples
2.http://blog.loftninjas.org/2010/04/08/an-evening-with-munin-graph-aggregation/

谢谢关注。

答案1

我终于让它工作了。Munin 并不那么糟糕,你只需要花几个晚上使用它。

我误解了文档,您不需要提及主机名。插件名称应与 munin 节点上的名称完全相同。此外,相同的插件应存在于 Munin-master 上,且名称为 __。

因此,/etc/munin/plugins 中的符号链接现在如下所示:

postgres_checkpoints__-> /usr/share/munin/plugins/postgres_checkpoints

这是新的配置,请注意“:”后的插件名称中没有主机名:

postgres_checkpoints_total.update no  
pg_checkpoints.label Graph label  
postgres_checkpoints_total.graph yes  
postgres_checkpoints_total.graph_args --base 1000 -l 0  
postgres_checkpoints_total.cdef 0  
postgres_checkpoints_total.graph_category PG Total Checkpoints  
postgres_checkpoints_total.graph_title Aggregated checkpoints  
postgres_checkpoints_total.graph_vlabel Total Checkpoints  
postgres_checkpoints_total.checkpoints_req_total.label Total Req checkpoints  
postgres_checkpoints_total.checkpoints_timed_total.label Total Timed checkpoints  
postgres_checkpoints_total.graph_order checkpoints_req_total checkpoints_timed  
postgres_checkpoints_total.checkpoints_req_total.sum \  
        <internal_ip>.us-est-1.compute.internal:postgres_checkpoints.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_req

postgres_checkpoints_total.checkpoints_timed_total.sum \  
        <internal_ip>.us-west-.compute.internal:postgres_checkpoints.checkpoints_timed \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_timed \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_timed

另外,请注意,现在在上面的配置中我正在聚合 2 个功能。

相关内容