我知道这个问题之前已在很多论坛上被问过好几次了,但我仍然遇到类似的问题。
单个图表可以正常工作,但聚合图表则不行。我甚至没有得到一个空图表(没有数据的图表)。
所有机器都在 Ubuntu-12.04 m1.medium ec2 实例上运行。Munin 版本是 1.4.6。
我的 munin.conf 看起来像......
[localhost.localdomain]
地址 127.0.0.1
use_node_name 是[.us-west-1.compute.internal]
地址
use_node_name 是[.us-west-1.compute.internal]
地址
use_node_name 是[.us-west-1.compute.internal]
地址
use_node_name 是[us-west-1.compute.internal;totalcheckpoints]
更新 无
联系人 无postgres_checkpoints_checkpoints_req.update no postgres_checkpoints_checkpoints_req.graph yes postgres_checkpoints_checkpoints_req.graph_args --base 1000 -l 0 postgres_checkpoints_checkpoints_req.cdef 0 postgres_checkpoints_checkpoints_req.graph_category PG Total Checkpoints postgres_checkpoints_checkpoints_req.graph_title Aggregated checkpoints postgres_checkpoints_checkpoints_req.graph_vlabel Total Checkpoints postgres_checkpoints_checkpoints_req.checkpoints_req_total.label Total checkpoints postgres_checkpoints_checkpoints_req.graph_order checkpoints_req_total postgres_checkpoints_checkpoints_req.checkpoints_req_total.sum \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req
我已尝试在 /etc/munin/plugins 中跟踪符号链接:
postgres_checkpoints -> /usr/share/munin/plugins/postgres_checkpoints
postgres_checkpoints_ -> /usr/share/munin/plugins/postgres_checkpoints
postgres_checkpoints__ -> /usr/share/munin/plugins/postgres_checkpoints
作为 munin 用户,遵循 munin 命令运行正常,并且我在输出中没有看到任何明显错误:
sudo su - munin -s /bin/bash
/usr/share/munin/munin-update --debug --nofork
/usr/share/munin/munin-graph --debug --nofork --nolazy
/usr/share/munin/munin-html --debug
telnet 返回插件 postgres_checkpoints 的正确信息:
munin@hostname:~$ telnet 4949
尝试...
连接到。
转义符为“^]”。
# munin node at internal-ip-of-munin-node.us-west-1.compute.internal
config postgres_checkpoints
graph_title PostgreSQL 检查点
graph_vlabel 检查点/分钟
graph_category PostgreSQL
graph_info 每分钟检查点数
graph_args --base 1000
graph_period 分钟 checkpoints_timed.label 定时检查点
checkpoints_timed.info 超时启动的检查点
checkpoints_timed.type DERIVE
checkpoints_timed.draw LINE1
checkpoints_req.label 请求的
检查点
checkpoints_req.info 按请求启动的检查点
checkpoints_req.type DERIVE
checkpoints_req.draw STACK
。
获取 postgres_checkpoints
checkpoints_timed.value 2860
checkpoints_req.value
37.
退出
munin-master 和 munin-node 上的日志未显示任何明显错误。还验证了所有主机名都是正确的 fqdn。
知道我遗漏了什么吗?
我检查了很多论坛和链接。但是 serverfault 不允许我粘贴我引用的两个以上链接:
1.http://munin-monitoring.org/wiki/aggregate_examples
2.http://blog.loftninjas.org/2010/04/08/an-evening-with-munin-graph-aggregation/
谢谢关注。
答案1
我终于让它工作了。Munin 并不那么糟糕,你只需要花几个晚上使用它。
我误解了文档,您不需要提及主机名。插件名称应与 munin 节点上的名称完全相同。此外,相同的插件应存在于 Munin-master 上,且名称为 __。
因此,/etc/munin/plugins 中的符号链接现在如下所示:
postgres_checkpoints__-> /usr/share/munin/plugins/postgres_checkpoints
这是新的配置,请注意“:”后的插件名称中没有主机名:
postgres_checkpoints_total.update no pg_checkpoints.label Graph label postgres_checkpoints_total.graph yes postgres_checkpoints_total.graph_args --base 1000 -l 0 postgres_checkpoints_total.cdef 0 postgres_checkpoints_total.graph_category PG Total Checkpoints postgres_checkpoints_total.graph_title Aggregated checkpoints postgres_checkpoints_total.graph_vlabel Total Checkpoints postgres_checkpoints_total.checkpoints_req_total.label Total Req checkpoints postgres_checkpoints_total.checkpoints_timed_total.label Total Timed checkpoints postgres_checkpoints_total.graph_order checkpoints_req_total checkpoints_timed postgres_checkpoints_total.checkpoints_req_total.sum \ <internal_ip>.us-est-1.compute.internal:postgres_checkpoints.checkpoints_req \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_req \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_req postgres_checkpoints_total.checkpoints_timed_total.sum \ <internal_ip>.us-west-.compute.internal:postgres_checkpoints.checkpoints_timed \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_timed \ <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_timed
另外,请注意,现在在上面的配置中我正在聚合 2 个功能。