路漫漫其修远兮
吾将上下而求索

zabbix学习:总结

如果客户端执行命令比较慢,经常超时,要设置客户端和server端的超时时间,
Timeout=20



zabbix当template里面discovery自动发现功能关闭后,自动发现功能里面的选项修改后,对已有的主机的已有的发现项目不起作用,
当自动发现再打开,已有的监控项更新为最新的项目



{Template Redis Montior:Redis.Info[{#REDISPORT} status].max(10m)}=0 or {Template Redis Montior:Redis.Info[{#REDISPORT} status].nodata(10m)}=1
10分钟内最大值为0或者10分钟没有数据



zabbix当template里面discovery自动发现改{Template Redis Montior:Redis.Info[{#REDISPORT} status].max(3m)}=0
表示redis这个key在3分钟内的最大值为0,即3分钟都是0,会产生一个trigger



zabbix当template里面discovery自动发现改{Template Redis Montior:Redis.Info[{#REDISPORT} status].nodata(3m)}=1
表示redis这个key在3分钟没有数据返回就会产生一个trigger



Template Redis Montior里面:template-> template redis monitor-> discovery rules-> Redis server disccovery 里面
Keep lost resources period (in days)此选项意思为:如果监控项不见了,30天后删除,也就是说对应的trigger 30天后才删除,这段时间内都有报警
所有的模板的discovery里面过期时间都设置为30天

如果template里面的discovery的自动发现一直使能
但是如果机器的6331端口的进程因为故障杀掉了,这时自动发现规则发现不了6331,会将这个item列入待删项目,
The item is not discovered anymore and will be deleted ,超过时间后会被删除,
这时如果item设置了trigger,没有数据的时候报警,端口不存在属于没有数据,会报警,要在item被删之前发现报警处理,不然这个监控项就不见了,
对应的trigger也不见了,
如果item设置的trigger只有为0报警,没有设置没有数据也报警,则这个问题非常不好发现,数据接收不到不等于进程宕机,除非看host-item的时候才
知道这里出问题了
也就是说都要设置没有数据报警,删除时间为1一个月,保留更多的时间



客户端当所有都是主动模式,可以将下面参数设置为0,则客户端会关闭监听端口
StartAgents=0



当zabbix为主动模式的时候,web界面添加主机的时候,Host name名字必须要和zabbix_agentd.conf中的Hostname名字相同,不然错误
此时web界面下面的Agent interfaces里面的ip和端口不起作用,可以设置为:0.0.0.0:0 



在zabbix的触发器的函数里面,下面的意思表示web请求,在10分钟内,请求的结果的状态码为200的次数小于1,触发触发器,意思是10分钟没有一次是成功的,状态码为0或者4xx都表示失败
{Template web_js Monitor:web.test.rspcode[js check,get u.js].count(10m,200)}<1

未经允许不得转载:江哥架构师笔记 » zabbix学习:总结

分享到:更多 ()

评论 抢沙发

评论前必须登录!