我在远程数据库服务器上使用 NRPE 运行该check_mysql
插件,虽然我可以获得有关服务器是否过程正在按需要工作,我看到插件输出了更多信息:
user@server:/etc/nagios# /usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -psnip
Uptime: 112398 Threads: 5 Questions: 10921804 Slow queries: 0 Opens: 4408 Flush tables: 1 Open tables: 416 Queries per second avg: 97.170|Connections=137481c;;; Open_files=0;;; Open_tables=416;;; Qcache_free_memory=1031832;;; Qcache_hits=0c;;; Qcache_inserts=0c;;; Qcache_lowmem_prunes=0c;;; Qcache_not_cached=9427651c;;; Qcache_queries_in_cache=0;;; Queries=10921805c;;; Questions=10917613c;;; Table_locks_waited=0c;;; Threads_connected=5;;; Threads_running=1;;; Uptime=112398c;;;
这让我想到我可以对诸如线程数或慢速查询之类的事物进行断言以生成警报状态。
问题是,我该怎么做?插件-w
和-c
参数仅处理主从时钟漂移,而不处理其他参数。
我是否需要编写一些自定义 shell 脚本来解析输出然后返回其自己的输出?或者 Nagios Core 中是否有内置工具可以进行此类处理?
答案1
最后,我决定最好的做法是按照插件规范编写一段自定义脚本,并使用 进行一些字符串处理awk
。以供将来参考(执行者警告):
#! /bin/bash
parse_mysql_output(){
METRIC=`/usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -p[REDACTED] | grep -shoP "${METRIC_NAME}: ([\d.]+)" | awk -F ': ' '{print $2}'`
if (($(echo "$METRIC <= $WARNING_THRESHOLD" | bc -l))); then
echo "OK - $METRIC_NAME: $METRIC"
exit 0
fi
if (($(echo "$METRIC > $WARNING_THRESHOLD" | bc -l))); then
if (($(echo "$METRIC <= $CRITICAL_THRESHOLD" | bc -l))); then
echo "WARNING - $METRIC_NAME: $METRIC"
exit 1
fi
fi
if (($(echo "$METRIC >= $CRITICAL_THRESHOLD" | bc -l))); then
echo "CRITICAL - $METRIC_NAME: $METRIC"
exit 2
fi
echo "INDETERMINATE STATE - $METRIC_NAME: $METRIC"
exit 3
}
if [[ -z "$1" || -z "$2" || -z "$3" ]]
then
echo "Missing parameters! Syntax: ./`basename $0` metric warning_threshold critical_threshold"
exit 3
else
METRIC_NAME=$1
WARNING_THRESHOLD=$2
CRITICAL_THRESHOLD=$3
fi
parse_mysql_output
在预期用例中,您将通过 NRPE 配置中的自定义命令调用它,并传递指标和阈值。调用之前,您需要根据安装要求更改连接。
欢迎反馈和评论。