公司有几个服务器开着多个memcached进程,除了要监控他们是否正常telnet通,实例是否存在外还要监控他们的缓存命中率。针对他们的缓存命中率进行报警。

   网上有个perl写的,需要编译安装。有个python写的,贴过来运行下,发现python库版本不对。这么简单的脚本搞得这么费劲,就手动写了个。

   越写就越觉得shell处理数据,函数,字符串数组这方面太弱势了。

   还好,凑合用吧。这个脚本比较简单,通过check_tcp脚本获取memcached的stats信息。然后将该信息格式化成一个字符串,然后将get_hits比上cmd_gets就能得到缓存命中率。基础原理比较简单。但是还要实现nagios的报警格式,以及性能数据的输出,支持pnp绘图。

   为了伸手党们方便些,将以前的函数直接按需插入到该脚本中,应该是复制粘贴运行就行。

   如果有bug请反馈!

#!/bin/bash################################检查memcached的命中率#加载nagios自带utils.sh################################source /usr/local/nagios/libexec/utils.shprint_usage(){    echo "check_memcached -H IP -P port -w warning -c critical"}####################获取命令行执行参数###################if  [ $# == 0 ];then    print_usage;    exit;elsewhile test -n "$1";do    case "$1" in        -H)            host=$2            shift            ;;        -P)            port=$2            shift            ;;        -w)            warning=$2            shift            ;;        -c)            critical=$2            shift            ;;        *)            echo "Unknown argument:$1"            print_usage            exit $STATE_UNKNOWN            ;;    esac    shiftdonefi#########################function div_f()#检查参数,返回两个数字比########################function div_f(){    ref=`awk -v num_a=$1 -v num_b=$2 'BEGIN{printf "%0.2f \n",num_a/num_b}'`;    echo $ref;}###################得到命中率函数##################function getMemcachedHits(){    memcachedinfo=`/usr/local/nagios/libexec/check_tcp -H $host -p $port -E -s 'stats\r\nquit\r\n' -e 'uptime' | tr "\r" "@"`    get_hits=`echo $memcachedinfo | grep -o "@ STAT get_hits [0-9]*"| awk '{print $4}'`    cmd_get=`echo $memcachedinfo | grep -o "@ STAT cmd_get [0-9]*"| awk '{print $4}'`    div_f $get_hits $cmd_get;}hits=`getMemcachedHits $host $port`;###################得到命中率所在区间##################function re_rang(){    rang=$hits;    interval_a=$critical;    interval_b=$warningl    if [[ $rang < $interval_a ]];then        echo "0";    elif [[ $rang < $interval_b ]];then        echo "1";    elif [[ $rang > $interval_b ]]||[[ $rang == $interval_b ]] ;then        echo "2";    else        return;    fi}res=`re_rang $critical $warning $hits`;case "$res" in    0)        echo "Critical memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;"        exit $STATE_CRITICAL        ;;    1)        echo "Warning  memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;"        exit $STATE_WARNING        ;;    2)        echo "Ok  memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;"        exit $STATE_OK        ;;    *)        echo "Unkown"        exit $STATE_UNKNOWN        ;;esac