公司有几个服务器开着多个memcached进程,除了要监控他们是否正常telnet通,实例是否存在外还要监控他们的缓存命中率。针对他们的缓存命中率进行报警。
网上有个perl写的,需要编译安装。有个python写的,贴过来运行下,发现python库版本不对。这么简单的脚本搞得这么费劲,就手动写了个。
越写就越觉得shell处理数据,函数,字符串数组这方面太弱势了。
还好,凑合用吧。这个脚本比较简单,通过check_tcp脚本获取memcached的stats信息。然后将该信息格式化成一个字符串,然后将get_hits比上cmd_gets就能得到缓存命中率。基础原理比较简单。但是还要实现nagios的报警格式,以及性能数据的输出,支持pnp绘图。
为了伸手党们方便些,将以前的函数直接按需插入到该脚本中,应该是复制粘贴运行就行。
如果有bug请反馈!
#!/bin/bash################################检查memcached的命中率#加载nagios自带utils.sh################################source /usr/local/nagios/libexec/utils.shprint_usage(){ echo "check_memcached -H IP -P port -w warning -c critical"}####################获取命令行执行参数###################if [ $# == 0 ];then print_usage; exit;elsewhile test -n "$1";do case "$1" in -H) host=$2 shift ;; -P) port=$2 shift ;; -w) warning=$2 shift ;; -c) critical=$2 shift ;; *) echo "Unknown argument:$1" print_usage exit $STATE_UNKNOWN ;; esac shiftdonefi#########################function div_f()#检查参数,返回两个数字比########################function div_f(){ ref=`awk -v num_a=$1 -v num_b=$2 'BEGIN{printf "%0.2f \n",num_a/num_b}'`; echo $ref;}###################得到命中率函数##################function getMemcachedHits(){ memcachedinfo=`/usr/local/nagios/libexec/check_tcp -H $host -p $port -E -s 'stats\r\nquit\r\n' -e 'uptime' | tr "\r" "@"` get_hits=`echo $memcachedinfo | grep -o "@ STAT get_hits [0-9]*"| awk '{print $4}'` cmd_get=`echo $memcachedinfo | grep -o "@ STAT cmd_get [0-9]*"| awk '{print $4}'` div_f $get_hits $cmd_get;}hits=`getMemcachedHits $host $port`;###################得到命中率所在区间##################function re_rang(){ rang=$hits; interval_a=$critical; interval_b=$warningl if [[ $rang < $interval_a ]];then echo "0"; elif [[ $rang < $interval_b ]];then echo "1"; elif [[ $rang > $interval_b ]]||[[ $rang == $interval_b ]] ;then echo "2"; else return; fi}res=`re_rang $critical $warning $hits`;case "$res" in 0) echo "Critical memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;" exit $STATE_CRITICAL ;; 1) echo "Warning memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;" exit $STATE_WARNING ;; 2) echo "Ok memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;" exit $STATE_OK ;; *) echo "Unkown" exit $STATE_UNKNOWN ;;esac