简述
zabbix监控redis实例有个不好的地方是只能监控固定的6379端口,如果是非6379端口的话,需要修改模板,如果主机有多个redis实例的话,需要具有不同的redis模板,然后在管理监控,很是麻烦,为了解决这个问题,我使用lld(low level discovery)方式监控redis,只需要你在正则表达式里把需要监控的端口标上,就可以监控redis多实例。
参考
1、agent端操作
# cat redis_low_discovery.sh#!/bin/bash#Script_name redis_low_discovery.shredis() { port=($(sudo netstat -tpln | awk -F "[ :]+" '/redis/ && /0.0.0.0/ {print $5}')) printf '{\n' printf '\t"data":[\n' for key in ${!port[@]} do if [[ "${#port[@]}" -gt 1 && "${key}" -ne "$((${#port[@]}-1))" ]];then socket=`ps aux|grep ${port[${key}]}|grep -v grep|awk -F '=' '{print $10}'|cut -d ' ' -f 1` printf '\t {\n' printf "\t\t\t\"{#REDISPORT}\":\"${port[${key}]}\"},\n" else [[ "${key}" -eq "((${#port[@]}-1))" ]] socket=`ps aux|grep ${port[${key}]}|grep -v grep|awk -F '=' '{print $10}'|cut -d ' ' -f 1` printf '\t {\n' printf "\t\t\t\"{#REDISPORT}\":\"${port[${key}]}\"}\n" fi done printf '\t ]\n' printf '}\n'}$1
验证脚步是否正常
json监控redis的json展示
# bash redis_low_discovery.sh redis{ "data":[ { "{#REDISPORT}":"6381"}, { "{#REDISPORT}":"6382"} ]}
添加UserParameter
UserParameter=zabbix_low_discovery[*],/bin/bash /etc/zabbix/scripts/redis_low_discovery.sh $1UserParameter=redis_stats[*],(/bin/echo info; sleep 1) | telnet 127.0.0.1 $1 2>&1 |grep $2|cut -d : -f2
注:zabbix_agentd.conf配置文件中吧UnsafeUserParameters=1设置为1并打开注释即可,这里我的redis示例没有设置密码,如果有密码就加上-a password,telnet对空密码可以。有密码的话telnet换成$(which redis-cli)。然后重启agent即可
把redis_low_discovery.sh文件存放到/etc/zabbix/scripts/目录下,然后给与755权限,并修改用户与组为zabbix,同时允许zabbix用户无密码运行
echo "zabbix ALL=(root) NOPASSWD:/bin/netstat">>/etc/sudoers
关闭requiretty
sed -i 's/^Defaults.*.requiretty/#Defaults requiretty/' /etc/sudoers
如果不关闭requiretty的话,无法获取数据以及客户端日志提示如下信息
2、server端操作
使用zabbix_get获取redis键值
# zabbix_get -s 1.1.1.1 -k zabbix_low_discovery[redis]{"data":[ {"{#REDISPORT}":"6380"}, {"{#REDISPORT}":"6381"} ]}
redis每秒更新时间
# zabbix_get -s 1.1.1.1 -k redis_stats[6381,uptime_in_seconds]8
3、zabbix-server web界面导入模板以及主机连接模板,还需要设置正则等
设置正则
在“管理”—> “一般”—>“正则表达式”里,选择“新的正则表达式”
设置如下:
name:Redis regex
Result TRUE = ^(6380|6381)$
点击test,输入相应的字符串,至少匹配一个测试下。。有N个redis端口就写N个,随意填个存在的端口即可。。,没问题后点击update即可
最后把主机连接到模板上即可,默认间隔时间1小时,方便测试我改成60s,数据收集后然后改过了即可
稍等片刻查看结果图形。。。。
问题总结:
自动发现redis多实例问题总结如下:
现象是:redis多实例监控无法获取对应的item?
检查思路如下:
1:agent端可以使用脚步获取json化的信息
2:server端可以zabbix_get获取json化信息以及item的值
注:基于以上2步骤,按理说可以获取到相应的item值了。
3:打开agent端debug模式获取更多的日志信息,日志无问题,显示过程中没有显示json化的item
4:检查redis多实例模板中自动发现规则的键值与agent端中UnsafeUserParameters中定义键值不一样,修改与模板中对应的键值一样即可,重启agent即可