本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
本篇文章给大家谈谈zabbix监控告警配置,以及zabbix监控模式对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
今天给各位分享zabbix监控告警配置的知识,其中也会对zabbix监控模式进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
Zabbix配置企业微信群聊机器人告警
步骤:
[if !supportLists]1、 [endif]在zabbix告警目录新建wxrobot.py脚本
vi /usr/local/zabbix/share/zabbix/alertscripts/wxrobot.py
粘贴以下内容:
#!/usr/bin/python
#-*- coding: utf-8 -*-
import requests
import json
import sys
import os
headers = {'Content-Type': 'application/json;charset=utf-8'}
api_url = "复制群聊机器人Webhook地址到这"
def msg(text):
json_text= {
"msgtype": "text",
"text": {
"content": text
},
}
print requests.post(api_url,json.dumps(json_text),headers=headers).content
if __name__ == '__main__':
text = sys.argv[1]
msg(text)
保存退出
需要安装python插件库:pip install requests
授权和更改权限:
chmod +x *.py
chown zabbix:zabbix *.py
2.Zabbix页面配置
zabbix监控告警配置,新增告警媒介
配置动作
配置—动作—创建动作 , 事件源 选择 触发器
1、点击右上角,“ 创建动作 ”填写对应的信息
zabbix监控告警配置;在 动作 页面填写以下信息,这里例子为以主机内存使用率超过90%为例,
计算方式:
Aand B,需要同时符合条件里面添加的条件;
条件A:主机群组等于 Linux Servers;
条件B:触发器等于linux模板的物理内存使用率持续3分钟等于90%。
2、切换到 操作
操作: 也就是在符合动作里面配置好的条件时,做出对应的动作,具体的操作说明,请参考官网指导文档,填写好信息,然后点击 操作细节 里面的 添加
[if !supportLists]1、 [endif]恢复操作配置
到这就触发器告警企业微信群机器人发送配置完成了,动作日志可以在
报表 –动作日志 页面查看
附上格式配置,参数说明和其他的格式,请参考 使用宏
操作发送消息内容恢复操作发送消息内容
问题:{EVENT.NAME}
告警信息:{TRIGGER.NAME}
告警地址:{HOST.NAME}
监控项目:{ITEM.NAME}
监控取值:{EVENT.VALUE}
告警严重性:{EVENT.SEVERITY}
当前状态:{EVENT.STATUS}
告警时间:{EVENT.DATE} {EVENT.TIME}
事件ID:{EVENT.ID}
告警信息:{TRIGGER. NAME}
告警地址:{HOST.NAME}
监控项目:{ITEM.NAME}
监控取值:{EVENT.RECOVERY.VALUE}
告警严重性:{EVENT.SEVERITY}
当前状态:{EVENT.RECOVERY.STATUS}
告警时间:{EVENT.DATE} {EVENT.TIME}
恢复时间:{EVENT.RECOVERY.TIME}
持续时间:{EVENT.AGE}
事件ID:{EVENT.RECOVERY.ID}
技术交流欢迎加入Q群:177428068
zabbix 告警
根据支持的时间定义的事件:
生成触发器的动作
邮件告警就配置成功
在为对应的用户添加对应的邮箱即可。
内容:
编写通知脚本
创建媒体类型
用户指定媒体类型
在sever端,自定义脚本发
1.首先在要在server编写对应的可执行的脚本
首先脚本文件的编写
接下来为脚本文件添加可执行权限
chmod +x sendmail.py
接下来将脚本文件安装到zabbix告警媒介文件夹下
vim /etc/zabbix/zabbix_server.conf
将sendmail文件移动到对应的目录下:
接下来就可以在前端上配置对应的告警媒介
参数:
{ALERT.SENDTO}收件人地址
{ALERT.SUBJECT}主题
{ALERT.MESSAGE}详细内容
在经过测试确认可用之后,就有新的告警媒介了。
像一般的告警介质一样使用就可以了。
去设置对应的告警就可以了
zabbix 告警等级怎么设置
zabbix的告警通知非常灵活,支持的通知类型有Email、Jabber、sms、script 。其在设备需要修护时,同样可以提供同nagios 一样的设备维护期间,暂停告警的功能有,而且其相对于nagios 更加灵活。本篇就针对zabbix的告警和设备维护功能进行下说明。
一、media types 告警通知本篇以脚本通知为例进行说明
1、配置AlertScriptsPath# vim /etc/zabbix/zabbix_server.conf
找到# AlertScriptsPath=${datadir}/zabbix/alertscripts 行,增加如下内容
AlertScriptsPath=/etc/zabbix/alertscripts配置完成后,需要重启zabbix_server服务生效,在后面media type 写入的脚本名称就会从上面的配置目录中查找并执行。2、创建media type步骤为:登录 zabbix web 页面------Administration--------Media types--------Create Media Type(右上角) ,如下图:配置完成后,save保存即可。
3、创建Action步骤为:登录 zabbix web 页面---- Configuration ---- Actions ---- Create action , 如下图subject为发送主题,message为发送内容(通过message内容的自定义,可以例如在告警时,将其他相关信息也进行通知,可以从侧面了解整个主机的运行情况---某次面试时面试官曾提过的需求),这两者的内容都可以很方便的进行更改。勾选了Recovery message 选项,会在监控项恢复时也会给一个恢复的提示。condeitions 选项中设置的是触发通知的条件,默认情况下只有A、B两项 ,这里可以设置触发级别、主机组、主机、触发值、应用等 。举例说明下:
1、可以根据告警级别进行通知,如severity 级别大于等于average时,通知OPS运维人员,级别为Disater时通知部门经理或者BOSS (这需要配置两个action);
2、也可以根据时间进行定义,如只在工作时间进行告警通知;
3、如果你喜欢的话,也可以指定不同主机组通知到不同的人;
而且所有条件之间的关系可以是AND或者OR ,默认情况下都是AND,即所有条件都满足时,触发通知。
注:个别主机,如DB主机,晚上有备份任务导致晚上某段时间过载(同时又不是所有主机都这样,又不想增大触发条件的话),可以在configuation ---hosts 里的items 选项里配置通知的时间范围,那里也有 time period 配置选项(从另一方面也反映了zabbix的灵活,有宏观调控,也有微观调控,适用性很强) 。不过要尽可能的都在actions 里进行配置,因为这一般查看具体条件都是在这里 。下图是action的Operations部分,该项是必填项: Operation details 是一个比较强的配置项,这里主要有三个知识点---Escalations、remote command 和 event acknowledged,其中Escalations、remote command比较重要 。
operation details 的 step部分主要和escalations 相关,在监控场景中,如果你一天收到100+的短信告警,真有一天“狼”真来了估计你也不会注意到。有了escalations功能,可以实现如下配置(需配置多条operation):
1、在单位时间内(step duration)发送的总的通知次数(to - from +1 次),并通知到相应的组或人;
2、假如条件1中设置的是1800秒内发送1-5 次给OPS运维人员,结果运维人员在该时间段未能处理;我们就可以再增加一个Operations,指定from 5 to 10 (第5到10条告警)通知给 运维经理 ;我们还可以再增加,第11-15条给BOSS ,第16-20条告警时执行一个远程命令。
escalations部分,可以参看官方文档。第二个知识点就是Operation type部分,类型可以是send message进行通知,也可以是remote command :
remote command 可以支持的操作有IPMI、Custom script、ssh、telnet、Global script (其中前两者只能在zabbix server 或 zabbix proxy上操作),该功能是相当牛B的。如,检测到一个tomcat 服务404,我们就可以利用该功能重启tomcat 服务 。
remote command部分可以查看官方页面。第三个功能主要是为有值班人员或上班时间准备的一个功能,当设置这个条件时,如果一个告警的状态被设置为ACK ,则本次告警的后续通知就会停止 。在一线运维人员接到告警信息时,在zabbix 的首页上,移到相应告警提示的部分,选择主机的ACK 部分 ,点选 NO ,会跳出一个message的窗口,在message里输入相关信息 ,如:误报、因什么什么原因在调试、已通知到相关责任人等 ,并点击Acknowledge 提交,此时的ACK 状态会变成YES 。本次告警也将停止不再进行。直到本次告警解决,下次再次出现同样告警时,该项又会重新变成ACK 。Acknowledge部分,可以参看官文页面。二、maintenance 维护在线场景中,经常会遇到这样的情况:在线产品需要进行升级或其他操作,此时又不想将监控系统的完整告警功能进行全部关闭,只临时关闭在线升级主机的告警。这就可以使用zabbix的maintenance功能。具体配置方式如下:
创建maintenance的步骤为:登录 zabbix web 页面---- Configuration-----Maintenance ----- create maintenance period ,如下图所示:第一选项卡配置的是任务名和一个大范围的时间值,其指定了维护所在的磊的时候段在什么范围。maintenance type 指定在维护期间是否仍进行数据搜集。 periods指定的时间段具体的维护时间段,和maintenace中的范围为包含关系。而period type指定了执行的类型,其类型有one time only 一次执行,也有按日、星期或月定期执行 ,如果是后三种方式,date项会变成具体的间隔、开始时间 。无论是何种类型,都有maintenance period length型 ,其指定了具体每次维护的持续时间,如2小时。hosts groups 项太多内容,就是选择某组主机或某个主机在维护期间不进行告警通知。
zabbix的各种报警机制实战
动作: 指定将报警信息发送给谁/定义报警的信息/定义报警的类型(邮件 微信 电话)
触发器: 设定某个监控项报警的阈值条件,可以实现报警提示(条件表达式),默认页面提示报警
https://www.jianshu.com/p/7d798423ec58
https://www.jianshu.com/p/a6c3a551f2ec
配置 ------ 主机 --- 对应主机的监控项
配置 ---- 主机 ---- 选择相应监控主机触发器 --- 创建触发器
页面正常
把zabbix_agent的nginx停掉
页面出现报错信息
把服务重新启动
报警信息消失
右上角的小人头--- 正在发送消息
配置 --- 动作 --- 将默认动作进行开启
管理 ---- 报警媒介类型 --- 创建媒介类型
点击右上角的小人头
再点击 添加
点击 更新
停掉nginx
三个用户,均已收到
https://work.weixin.qq.com/wework_admin/loginpage_wx?redirect_uri=https://work.weixin.qq.com/wework_admin/frame#profile
点击 成员加入
选择一种加入方式并加入
成员加入后,点击 通讯录 可查看加入的成员
收集相关程序代理id和密钥和企业id
程序代理id: 1000003
程序密钥: nR0WyfP7251_jg6vOSQ4SpTrZlrWS-SVm_2nyrXTf6Y
企业id: ww7a34cccfb9fd932b
在zabbix_server端找到脚本存放路径
编写脚本,填写对应的企业和程序信息
脚本执行语法格式: 帐号 + 主题 + 内容
用户名可以在通讯录找到
出现报错: ImportError: No module named requests ,缺少 requests 模块
报错解决:
再次测试:
成功收到测试信息!
管理 --- 报警媒介类型 -- 创建媒介类型
配置接收微信的人员
点击 小人头 --- 报警媒介 ---- 添加
点击 添加
点击 更新
把zabbix_agent的nginx服务停掉
发现报错
这是临时生成的日志没有写入权限
解决办法:
在zabbix_server端更改日志所主
再次测试
报警成功!
1).利用阿里大鱼(收费)
https://www.aliyun.com/product/sms?spm=a3142.7791109.0.0.34691fd2OVGqAY
2)利用onealert发送报警
https://caweb.aiops.com/#/integrate/monitor
这里我们使用 onealert
配置 --- 新建通知
集成 --- zabbix
2.获取alert agent包
3.安装配置alert
配置 --- 动作
在动作日志查看,发现已送达,但是我们选择的是免费版的,所以收不到邮件.....
Zabbix配置企业微信群(机器人)警告
企业微信机器人告警
企业微信群聊里面增加机器人,机器人会提供发送信息的URL
python 脚本进行实现
1、创建企业微信机器人
这个 webhook 后面需要使用到
2、配置 zabbix server
3、zabbix Web 页面配置
默认标题:
恢复操作:
创建动作
4、测试发送告警
第五节 实现zabbix报警功能之页面信息报警和页面提示声音报警
1.1 页面提示信息报警和页面提示声音报警
配置-----主机-----点击相应主机的触发器-----创建创建触发器
配置触发器
查看页面报警提示信息
工作中处理页面报警信息的思路
工作中遇见告警信息处理思路步骤:
第一步: 看到告警提示信息,定位主机信息
第二步: 看到主机信息之后,定位报警原因 获得监控项Key值
第三步: 根据key值信息,最终获得报警原因
1.2 页面提示声音报警
用户-----用户设置------正在发送消息--- 勾选前端信息
关于zabbix监控告警配置和zabbix监控模式的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。
zabbix监控告警配置的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于zabbix监控模式、zabbix监控告警配置的信息别忘了在本站进行查找喔。
暂时没有评论,来抢沙发吧~