从 Nagios 的 check_mysql 断言扩展信息

从 Nagios 的 check_mysql 断言扩展信息

我在远程数据库服务器上使用 NRPE 运行该check_mysql插件,虽然我可以获得有关服务器是否过程正在按需要工作,我看到插件输出了更多信息:

user@server:/etc/nagios# /usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -psnip
Uptime: 112398  Threads: 5  Questions: 10921804  Slow queries: 0  Opens: 4408  Flush tables: 1  Open tables: 416  Queries per second avg: 97.170|Connections=137481c;;; Open_files=0;;; Open_tables=416;;; Qcache_free_memory=1031832;;; Qcache_hits=0c;;; Qcache_inserts=0c;;; Qcache_lowmem_prunes=0c;;; Qcache_not_cached=9427651c;;; Qcache_queries_in_cache=0;;; Queries=10921805c;;; Questions=10917613c;;; Table_locks_waited=0c;;; Threads_connected=5;;; Threads_running=1;;; Uptime=112398c;;;

这让我想到我可以对诸如线程数或慢速查询之类的事物进行断言以生成警报状态。

问题是,我该怎么做?插件-w-c参数仅处理主从时钟漂移,而不处理其他参数。
我是否需要编写一些自定义 shell 脚本来解析输出然后返回其自己的输出?或者 Nagios Core 中是否有内置工具可以进行此类处理?

答案1

最后,我决定最好的做法是按照插件规范编写一段自定义脚本,并使用 进行一些字符串处理awk。以供将来参考(执行者警告):

#! /bin/bash

parse_mysql_output(){
    METRIC=`/usr/lib/nagios/plugins/check_mysql -H localhost -P 3306 -u nagios -p[REDACTED] | grep -shoP "${METRIC_NAME}: ([\d.]+)" | awk -F ': ' '{print $2}'`
    if (($(echo "$METRIC <= $WARNING_THRESHOLD" | bc -l))); then
        echo "OK - $METRIC_NAME: $METRIC"
        exit 0
    fi

    if (($(echo "$METRIC > $WARNING_THRESHOLD" | bc -l))); then
        if (($(echo "$METRIC <= $CRITICAL_THRESHOLD" | bc -l))); then
            echo "WARNING - $METRIC_NAME: $METRIC"
            exit 1
        fi
    fi

    if (($(echo "$METRIC >= $CRITICAL_THRESHOLD" | bc -l))); then
        echo "CRITICAL - $METRIC_NAME: $METRIC"
        exit 2
    fi

    echo "INDETERMINATE STATE - $METRIC_NAME: $METRIC"
    exit 3
}

if [[ -z "$1" || -z "$2" || -z "$3" ]]
then
    echo "Missing parameters! Syntax: ./`basename $0` metric warning_threshold critical_threshold"
    exit 3
else
    METRIC_NAME=$1
    WARNING_THRESHOLD=$2
    CRITICAL_THRESHOLD=$3
fi

parse_mysql_output

在预期用例中,您将通过 NRPE 配置中的自定义命令调用它,并传递指标和阈值。调用之前,您需要根据安装要求更改连接。

欢迎反馈和评论。

相关内容