zabbix告警延迟(zabbix停止服务)

来源网友投稿 946 2022-12-23

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
本篇文章给大家谈谈zabbix告警延迟,以及zabbix停止服务对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享zabbix告警延迟的知识,其中也会对zabbix停止服务进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

Zabbix延迟极高,应该怎么优化

首先在zabbix-server上也装上zabbix-agentzabbix告警延迟,并启用Template App Zabbix Server模板zabbix告警延迟,监控zabbix-server服务内部zabbix告警延迟的各项参数。启用模板后会新增加相应的监控项item、图形graph、触发器trigger。
类似这样的监控项会增加不少

zabbix 告警

根据支持的时间定义的事件:

生成触发器的动作

邮件告警就配置成功

在为对应的用户添加对应的邮箱即可。

内容:

编写通知脚本

创建媒体类型

用户指定媒体类型

在sever端,自定义脚本发

1.首先在要在server编写对应的可执行的脚本

首先脚本文件的编写

接下来为脚本文件添加可执行权限

chmod +x sendmail.py

接下来将脚本文件安装到zabbix告警媒介文件夹下

vim /etc/zabbix/zabbix_server.conf

将sendmail文件移动到对应的目录下:

接下来就可以在前端上配置对应的告警媒介

参数:

{ALERT.SENDTO}收件人地址

{ALERT.SUBJECT}主题

{ALERT.MESSAGE}详细内容

在经过测试确认可用之后,就有新的告警媒介了。

像一般的告警介质一样使用就可以了。
去设置对应的告警就可以了

zabbix监控交换机端口流量,自定义图表显示数据,但图表显示的数据与当前时间存在8分钟延迟

说明zabbix告警延迟
Zabbix监控服务端已经配置完成,现在要使用Zabbix对交换机进行监控。
具体操作:
以下操作在被监控的交换机上进行,这里以Cisco交换机为例。
一、登录到Cisco交换机,开启snmp服务
注意:使用telnet或者仿真终端登录到交换机特权配置模式
enable #切换到特权模式
configure terminal #进入全局配置模式
snmp-server community public ro #打开交换机snmp服务,设置团体名称为public,只读
snmp-server community cisco rw #打开交换机snmp服务,设置团体名称为cisco,读写
snmp-server enable traps #启用snmp陷阱
exit #退出全局配置模式
show run #查看当前配置信息
exit #退出特权模式
二、使用Getif查看交换机端口信息
下载Getif
安装完成之后,打开软件
注意:Windows 7/8/8.1系统需要单击右键,选择以管理员身份运行,否则软件打开失败zabbix告警延迟
Host name:交换机ip地址
Read:public
其他默认
点Start
连接成功后如下图所示:
切换到interface选项卡,点Start连接后查看交换机所有的端口信息,并记录下来,如下图所示:
切换到MBrowser选项卡
选择iso-org-dod-internet-mgmt-mib-2-interface-ifTable-ifEntry-ifInOctets
点Start
连接成功后如下图所示:
注意:
ifInOctets #交换机端口进流量
ifOutOctets #交换机端口出流量
查看交换机端口出流量:
iso-org-dod-internet-mgmt-mib-2-interface-ifTable-ifEntry-ifOutOctets
interfaces.ifTable.ifEntry.ifInOctets.1对应交换机的Vlan1接口,其OID值为:1.3.6.1.2.1.2.2.1.10.1
interfaces.ifTable.ifEntry.ifInOctets.5179对应交换机的StackPort1接口,其OID值为:1.3.6.1.2.1.2.2.1.10.5179
interfaces.ifTable.ifEntry.ifInOctets.10101对应交换机的GigabitEthernet1/0/1接口,其OID值为:1.3.6.1.2.1.2.2.1.10.10101
以此类推
根据在interface选项卡中的int值,查看当前交换机该端口的OID值,然后在Zabbix中使用OID值对交换机端口进行监控。
这里列出了Cisco几款交换机的端口和OID值
1、C3750E端口
ifInOctets #进口流量 1.3.6.1.2.1.2.2.1.10.
ifOutOctets #出口流量 1.3.6.1.2.1.2.2.1.16.
1 Vlan1
5179 StackPort1
5180 StackSub-St1-1
5181 StackSub-St1-2
10101 GigabitEthernet1/0/1
10102 GigabitEthernet1/0/2
10103 GigabitEthernet1/0/3
10104 GigabitEthernet1/0/4
10105 GigabitEthernet1/0/5
10106 GigabitEthernet1/0/6
10107 GigabitEthernet1/0/7
10108 GigabitEthernet1/0/8
10109 GigabitEthernet1/0/9
10110 GigabitEthernet1/0/10
10111 GigabitEthernet1/0/11
10112 GigabitEthernet1/0/12
10113 GigabitEthernet1/1/1
10114 GigabitEthernet1/1/2
10115 GigabitEthernet1/1/3
10116 GigabitEthernet1/1/4
10201 TenGigabitEthernet1/1/1
10202 TenGigabitEthernet1/1/2
14501 Null0
14502 FastEthernet0
2、C2960S端口
ifInOctets #进口流量 1.3.6.1.2.1.2.2.1.10.
ifOutOctets #出口流量 1.3.6.1.2.1.2.2.1.16.
1 Vlan1
10101 GigabitEthernet0/1
10102 GigabitEthernet0/2
10103 GigabitEthernet0/3
10104 GigabitEthernet0/4
10105 GigabitEthernet0/5
10106 GigabitEthernet0/6
10107 GigabitEthernet0/7
10108 GigabitEthernet0/8
10109 GigabitEthernet0/9
10110 GigabitEthernet0/10
10111 GigabitEthernet0/11
10112 GigabitEthernet0/12
10113 GigabitEthernet0/13
10114 GigabitEthernet0/14
10115 GigabitEthernet0/15
10116 GigabitEthernet0/16
10117 GigabitEthernet0/17
10118 GigabitEthernet0/18
10119 GigabitEthernet0/19
10120 GigabitEthernet0/20
10121 GigabitEthernet0/21
10122 GigabitEthernet0/22
10123 GigabitEthernet0/23
10124 GigabitEthernet0/24
10125 GigabitEthernet0/25
10126 GigabitEthernet0/26
10127 GigabitEthernet0/27
10128 GigabitEthernet0/28
10129 GigabitEthernet0/29
10130 GigabitEthernet0/30
10131 GigabitEthernet0/31
10132 GigabitEthernet0/32
10133 GigabitEthernet0/33
10134 GigabitEthernet0/34
10135 GigabitEthernet0/35
10136 GigabitEthernet0/36
10137 GigabitEthernet0/37
10138 GigabitEthernet0/38
10139 GigabitEthernet0/39
10140 GigabitEthernet0/40
10141 GigabitEthernet0/41
10142 GigabitEthernet0/42
10143 GigabitEthernet0/43
10144 GigabitEthernet0/44
10145 GigabitEthernet0/45
10146 GigabitEthernet0/46
10147 GigabitEthernet0/47
10148 GigabitEthernet0/48
10149 GigabitEthernet0/49
10150 GigabitEthernet0/50
12001 Null0
12002 FastEthernet0
3、 C3560端口
ifInOctets #进口流量 1.3.6.1.2.1.2.2.1.10.
ifOutOctets #出口流量 1.3.6.1.2.1.2.2.1.16.
1 Vlan1
10101 GigabitEthernet0/1
10102 GigabitEthernet0/2
10103 GigabitEthernet0/3
10104 GigabitEthernet0/4
10105 GigabitEthernet0/5
10106 GigabitEthernet0/6
10107 GigabitEthernet0/7
10108 GigabitEthernet0/8
10109 GigabitEthernet0/9
10110 GigabitEthernet0/10
10111 GigabitEthernet0/11
10112 GigabitEthernet0/12
10113 GigabitEthernet0/13
10114 GigabitEthernet0/14
10115 GigabitEthernet0/15
10116 GigabitEthernet0/16
10117 GigabitEthernet0/17
10118 GigabitEthernet0/18
10119 GigabitEthernet0/19
10120 GigabitEthernet0/20
10121 GigabitEthernet0/21
10122 GigabitEthernet0/22
10123 GigabitEthernet0/23
10124 GigabitEthernet0/24
10125 GigabitEthernet0/25
10126 GigabitEthernet0/26
10127 GigabitEthernet0/27
10128 GigabitEthernet0/28
10129 GigabitEthernet0/29
10130 GigabitEthernet0/30
10131 GigabitEthernet0/31
10132 GigabitEthernet0/32
10133 GigabitEthernet0/33
10134 GigabitEthernet0/34
10135 GigabitEthernet0/35
10136 GigabitEthernet0/36
10137 GigabitEthernet0/37
10138 GigabitEthernet0/38
10139 GigabitEthernet0/39
10140 GigabitEthernet0/40
10141 GigabitEthernet0/41
10142 GigabitEthernet0/42
10143 GigabitEthernet0/43
10144 GigabitEthernet0/44
10145 GigabitEthernet0/45
10146 GigabitEthernet0/46
10147 GigabitEthernet0/47
10148 GigabitEthernet0/48
10149 GigabitEthernet0/49
10150 GigabitEthernet0/50
10151 GigabitEthernet0/51
10152 GigabitEthernet0/52
10501 Null0
三、在Zabbix中添加对交换机的监控
1、添加主机
打开Zabbix
组态-主机群组-创建主机群组
组名:交换机
存档
组态-主机-创建主机
主机名称:交换机IP
群组:选择上一步创建的交换机
SNMP介面-IP地址:交换机IP
其他默认
状态:受检测中
存档
2、创建交换机监控模板
打开Zabbix
组态-模板-创建模板
模板名称:Cisco C3750E
群组:交换机
主机/模板:选择刚刚添加的交换机IP
存档
3、创建模板监控项目
主机-模板,选择刚才创建的模板Cisco C3750E
打开项目,如下图所示:
创建新监控
这里zabbix告警延迟我们监控Cisco C3750E交换机端口GigabitEthernet0/1的进口流量
名称:GigabitEthernet0/1 In
类型:SNMPv2端点代理程式
键值:ifInOctets.10101
SNMP OID:1.3.6.1.2.1.2.2.1.10.10101
SNMP community:public
数据类型:数字的(无正负)
数据类型:十进制数字
单位:bps
使用自订倍数:打钩 8
数据更新间隔:60
History storage period (in days):7
Trend storage period (in days):365
储存值:差量(每秒速率)
展示值:不变
存档
4、创建监控图形
组态-主机
选择刚刚创建的交换机IP-图形
如下图所示:
创建图形
名称:GigabitEthernet0/1 In
添加,选择刚才创建的监控项目
存档
5、查看监控状态
打开Zabbix
检测中-图形
群组:交换机
主机:交换机IP
图形:GigabitEthernet1/0/1
如下图所示
至此,Zabbix监控交换机设置完成。
备注:Cisco交换机cpu和内存监控OID值
5秒内的cpu load(百分比)enterprises.9.2.1.56.0
snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.2.1.56.0
1分钟内的cpu load(百分比)
snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.2.1.57.0
5分钟内的cpu load(百分比)
snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.2.1.58.0
获取内存使用情况
snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.9.48.1.1.1.5
获取内存空闲情况
snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.9.48.1.1.1.6
当前内存使用
enterprises.9.9.48.1.1.1.5.1
1.3.6.1.4.1.9.9.48.1.1.1.5.1
1.3.6.1.4.1.9.9.48.1.1.1.5.2
1.3.6.1.4.1.9.9.48.1.1.1.5.16

zabbix告警配置

概述

假设zabbix告警延迟我们配置了一些监控项和触发器,现在当触发器状态改变时会获取一些发生的事件,是时候考虑下一步行动了。

我们不可能一直盯着触发器或者事件列表,当发生一些标志性的事件时发送警告再好不过。当问题发生,关注这些的用户都会被通知。

zabbix提供主要的功能就是发送告警就是这个原因。哪些人zabbix告警延迟?在什么时候?应该收到哪些信息是可以被定义的。

为了发送和接收来自zabbix的告警,你必须:

定义媒介

配置发送信息到定义媒介的动作

动作由 触发条件 和 操作 组成。基本上当条件符合时,操作被执行。两个主要的操作是 发送消息 和 执行远程命令

为了发现和自动注册创建的事件,一些额外的操作是可用的,包含添加或者删除主机,链接模板等

一、媒介(Media types)

概述

Media 是用于发送zabbix的消息与告警的递送通道

可以定义一下媒介类型

E-mail

SMS

Jabber

Ez Texting

Custom alertscripts

1、 E-mail

为消息定义E-mail发送通道,需要配置e-mail 作为媒介类型并且传递指定的地址给用户

配置

依次点击 管理——报警媒介类型,点击创建媒介类型(或者点击预先定义的媒介类型 E-mail)

媒介类型表包含通常的媒介类型属性

所有重要的字段都会标记红星

Name 媒介类型名字

Type 选择Email作为类型

SMTP server 设置stmp服务器作为处理信息的出口

SMTP server port 设置smtp服务的端口,这个参数从zabbix3.0开始支持

SMTP helo 这是正确的stmp链接值,通常为域名

SMTP email 这个地址会被用于信息发送者,用来发送消息,添加发送者的显示名 如 Zabbix_info则zabbix_info<gaoxiaoxu@126.com

几个可以生效的配置:

gaoxiaoxu@126.com 只有邮箱地址,不需要尖括号

zabbix_info<gaoxiaoxu@126.com 显示名与邮件地址,地址写在尖括号中

监控系统<gaoxiaoxu@126.com 使用UTF-8格式的显示名

Connection security 选择链接安全级别,None为不使用ssl选项,starttls 使用 CURLOPT_USE_SSL参数,SSL/TLS则CURLOPT_USE_SSL可选

SSL verify peer 标记checkbox同步SMTP服务的SSL证书,

Authentication 认证方法

Username 用户名

Password 密码

Enabled 启用媒介

注意 : 为了使SMTP中的authentication 选项可用,zabbix在编译时,需要带--with-libcurl参数 使用cURL7.20.0或更高版本

第二个选项卡options

第二个选项卡options配置了告警的处理流程。同样的options配置在其他的媒介类型中也存在。

所有媒介都是并行处理的,当前最大会话每个媒介自己定义,但是zabbix服务的告警处理总数被参数(zabbix_sever.conf)StartAlerters所限制。同一触发器生成的告警会序列化的处理

options表

concurrent sessions 并发会话数,三个选项,one(一个),unlimited(不限制),custom(自定义)

Attempts 尝试发送告警的次数,如果设置为1,则zabbix会发送以此通知,并且失败时不会重发

Attempts interval  重发通知的频率,发送失败时重发的间隔

配置用户的媒介

依次点击 Administration(管理)---Users(用户)

点击用户的属性表,在Media(媒介)表中点击add

type 选择Email作为类型

send to 指定email地址,可以点击add添加多个地址,同理此地址也可设置显示名如Zabbix_admin<gaoxiaoxu@126.com或者gaoxiaoxu@126.com

when active 设置发送时间如工作日(1-5,09:00-18:00)可以使用宏

Use if severity 指定想要接受的告警等级

status 启用与否

2、SMS

zabbix发送短信,使用串行GSM调试解调器连接到zabbix server的serial port

先决条件:

串行设备(正常情况下在linux的/dev/ttyS0)的速度取决于modem。zabbix不设置串行链接的速度。

zabbix user拥有对串行设备的读写权限,运行ls -l /dev/ttyS0查看当前权限

GSM调试解调器拥有PIN码,PIN也可以禁用使用命令 AT+CPIN="NNNN"输入PIN, 必须有双引号。

已经测试好的modem Siemens MC35 Teltonika ModemCOM/G10

配置SMS作为发送通道,需要配置SMS作为媒介类型并且在用户界面配置接收手机号

配置

依次点击 Administration---Media types,点击创建media type或使用预先的配置

sms的Media type表属性

Description media type名

Type 选择SMS

GSM modem 选择设备如 /dev/ttyS0

options选项卡见E-mail

配置用户媒介

依次点击 Administration(管理)---Users(用户)

点击用户的属性表,在Media(媒介)表中点击add

types 选择SMS作为媒介

Send to 输入用户手机号

When active 设置发送时间如工作日(1-5,09:00-18:00)可以使用宏

Use if severity 指定想要接受的告警等级

status 启用与否

3、Jabber (略)

4、Ez Texing(略)

5、Custom alertscripts

如果不满足于存在的媒介来发送警告,可以自定义脚本进行发送

警告脚本在zabbix server上执行,这些脚本位于server配置文件AlertScriptsPath变量(默认/usr/local/share/zabbix/alertscripts)

脚本示例:

#zabbix告警延迟!/bin/bash

to=$1

subject=$2

body=$3

cat <<EOF |mail -s "$subject" "$to"

$bodyEOF

从3.4开始zabbix会检查exit code(shell执行返回码,0为成功),若exit code 不等于0,则认为执行失败,zabbix会重复执行

script不保存环境变量,所以环境变量要精确指定

配置

依次点击 Administration---Media types,点击创建media type

mediatype表属性

Name 输入媒介的名字

Type 选择Script作为类型

Script name 输入脚本的名字(zabbix server中的脚本文件)

Script parameters 添加命令行参数到脚本

可支持ALERT.SENDTO}、{ALERT.SUBJECT}、{ALERT.MESSAGE}等宏,

{ALERT.SENDTO} 用户媒介中的send to(收件人)的值

{ALERT.SUBJECT} 动作配置中的Default subject(默认标题)

{ALERT.MESSAGE} 动作配置中的Default message(消息内容)

options表中定义了处理流程,见E-mail的说明

配置用户媒介User media

依次点击 Administration(管理)---Users(用户)

点击用户的属性表,在Media(媒介)表中点击add

用户媒介属性

Type 选择自定义脚本的媒介类型

Send to 指定告警接收人

When active 设置发送时间如工作日(1-5,09:00-18:00)可以使用宏

Use if serverity 指定想要接受的告警等级

status 启用与否

二、动作

如果你希望发生事件时会触发一些操作,那么你需要配置action

动作可以定义回应所有支持的事件类型,

事件类型:

Trigger events触发器事件,当触发器状态从ok改变到problem或相反。

Discovery events 当自动发现产生

Auto registration events当新的agent自动注册时,或者经注册过的主机元数据改变

Internal events当监控项变为不支持或触发器状态变为unknown时

配置一个动作

依次 Configuration ——Actions

从event source中选择需要的源(分为:触发器源,自动发现源,自动注册源,事件源)

点击创建动作

选择操作执行的条件

选择具体操作

选择恢复操作

动作表的属性

Name 唯一动作名

Type of calcaulation 选择条件触发的计算方法

And 必须符合所有条件

Or 只要一个条件符合即可

And/Or 结合二者,不同类型的条件用And,同一类型的条件用Or

Custom expression 用户自定义

Conditions 触发动作的一系列条件、

New condition 选择新的动作触发条件

Enabled 启用动作

条件设置

基于触发器的条件

Application 应用集

Host group 主机组

Template 模板

Host 主机

Tag 标签(串)

tag value 标签值

Trigger 触发器

Trigger name 触发器名字

Trigger severity 触发器等级

Time period 触发时间

Problem is suppressed 触发问题是否意料之中,如主机维护

基于自动发现的条件

Host IP 指定主机ip地址自动发现范围 格式: 单独的ip:192.168.1.33 范围ip: 192.168.1-101.1-254  Ip mask: 192.168.4。0/24

Service type 服务类型

service port 服务端口

Discovery rule 指定自动发现规则

Discovery check

Discovery object

Discovery status

Uptime/Downtime

Received value

Proxy

基于自动注册的条件

Host metadata 由zabbix_agentd.conf 文件中的HostMetadata变量定义

Host name

Proxy

基于内部事件的条件

Application

Event type

Host group

Template

Host

条件匹配后,就需要执行响应的动作了

可以支持以下动作

send a message

execute a remote command

add host

remove host

enable host

disable host

add to host group

remove from host group

link to template

unlink from template

set host inventory mode

执行远程命令

确保配置文件中(zabbix_agentd.conf)EnableRemoteCommands 参数设置为1

加入zabbix用户到sudo,vim /etc/sudoer

zabbix ALL=NOPASS: ALL #所有命令不需密码

zabbix ALL=NOPASS: /etc/init.d/apache restart  #指定某一命令不需要密码

触发操作后,使用宏 编辑信息

如 告警信息模板

标题 服务器:{HOST.NAME} - 发生: {TRIGGER.NAME}故障

信息 告警主机:{HOST.NAME}

告警地址:{HOST.IP}

监控项目:{ITEM.NAME}

监控取值:{ITEM.LASTVALUE}

告警等级:{TRIGGER.SEVERITY}

当前状态:{TRIGGER.STATUS}

告警信息:{TRIGGER.NAME}

告警时间:{EVENT.DATE} {EVENT.TIME}

事件ID:{EVENT.ID}

恢复信息

标题 服务器:{HOST.NAME} - {TRIGGER.NAME} 已恢复

信息 告警主机:{HOST.NAME}

告警地址:{HOST.IP}

监控项目:{ITEM.NAME}

监控取值:{ITEM.LASTVALUE}

告警等级:{TRIGGER.SEVERITY}

当前状态:{TRIGGER.STATUS}

告警信息:{TRIGGER.NAME}

告警时间:{EVENT.DATE} {EVENT.TIME}

恢复时间:{EVENT.RECOVERY.DATE} {EVENT.RECOVERY.TIME}

持续时间:{EVENT.AGE}

事件ID:{EVENT.ID}

查询zabbix数据库alerts怎么看告警的恢复时间

zabbix的告警通知非常灵活,支持的通知类型有Email、Jabber、sms、script 。其在设备需要修护时,同样可以提供同nagios 一样的设备维护期间,暂停告警的功能有,而且其相对于nagios 更加灵活。本篇就针对zabbix的告警和设备维护功能进行下说明。
一、media types 告警通知
本篇以脚本通知为例进行说明
1、配置AlertScriptsPath
# vim /etc/zabbix/zabbix_server.conf
找到# AlertScriptsPath=${datadir}/zabbix/alertscripts 行,增加如下内容
AlertScriptsPath=/etc/zabbix/alertscripts
配置完成后,需要重启zabbix_server服务生效,在后面media type 写入的脚本名称就会从上面的配置目录中查找并执行。
2、创建media type
步骤为:登录 zabbix web 页面------Administration--------Media types--------Create Media Type(右上角) ,如下图:
配置完成后,save保存即可。
3、创建Action
步骤为:登录 zabbix web 页面---- Configuration ---- Actions ---- Create action , 如下图
subject为发送主题,message为发送内容(通过message内容的自定义,可以例如在告警时,将其zabbix告警延迟他相关信息也进行通知,可以从侧面zabbix告警延迟了解整个主机的运行情况---某次面试时面试官曾提过的需求),这两者的内容都可以很方便的进行更改。勾选了Recovery message 选项,会在监控项恢复时也会给一个恢复的提示。
condeitions 选项中设置的是触发通知的条件,默认情况下只有A、B两项 ,这里可以设置触发级别、主机组、主机、触发值、应用等 。举例说明下:
1、可以根据告警级别进行通知,如severity 级别大于等于average时,通知OPS运维人员,级别为Disater时通知部门经理或者BOSS (这需要配置两个action);
2、也可以根据时间进行定义,如只在工作时间进行告警通知zabbix告警延迟
3、如果你喜欢的话,也可以指定不同主机组通知到不同的人zabbix告警延迟
而且所有条件之间的关系可以是AND或者OR ,默认情况下都是AND,即所有条件都满足时,触发通知。
注:个别主机,如DB主机,晚上有备份任务导致晚上某段时间过载(同时又不是所有主机都这样,又不想增大触发条件的话),可以在configuation ---hosts 里的items 选项里配置通知的时间范围,那里也有 time period 配置选项(从另一方面也反映了zabbix的灵活,有宏观调控,也有微观调控,适用性很强) 。不过要尽可能的都在actions 里进行配置,因为这一般查看具体条件都是在这里 。
下图是action的Operations部分,该项是必填项:
Operation details 是一个比较强的配置项,这里主要有三个知识点---Escalations、remote command 和 event acknowledged,其中Escalations、remote command比较重要 。
operation details 的 step部分主要和escalations 相关,在监控场景中,如果你一天收到100+的短信告警,真有一天“狼”真来了估计你也不会注意到。有了escalations功能,可以实现如下配置(需配置多条operation):
1、在单位时间内(step duration)发送的总的通知次数(to - from +1 次),并通知到相应的组或人zabbix告警延迟
2、假如条件1中设置的是1800秒内发送1-5 次给OPS运维人员,结果运维人员在该时间段未能处理;我们就可以再增加一个Operations,指定from 5 to 10 (第5到10条告警)通知给 运维经理 ;我们还可以再增加,第11-15条给BOSS ,第16-20条告警时执行一个远程命令。
escalations部分,可以参看官方文档。
第二个知识点就是Operation type部分,类型可以是send message进行通知,也可以是remote command :
remote command 可以支持的操作有IPMI、Custom script、ssh、telnet、Global script (其中前两者只能在zabbix server 或 zabbix proxy上操作),该功能是相当牛B的。如,检测到一个tomcat 服务404,我们就可以利用该功能重启tomcat 服务 。
remote command部分可以查看官方页面。
第三个功能主要是为有值班人员或上班时间准备的一个功能,当设置这个条件时,如果一个告警的状态被设置为ACK ,则本次告警的后续通知就会停止 。
在一线运维人员接到告警信息时,在zabbix 的首页上,移到相应告警提示的部分,选择主机的ACK 部分 ,点选 NO ,会跳出一个message的窗口,在message里输入相关信息 ,如:误报、因什么什么原因在调试、已通知到相关责任人等 ,并点击Acknowledge 提交,此时的ACK 状态会变成YES 。本次告警也将停止不再进行。直到本次告警解决,下次再次出现同样告警时,该项又会重新变成ACK 。
Acknowledge部分,可以参看官文页面。
二、maintenance 维护
在线场景中,经常会遇到这样的情况:在线产品需要进行升级或其他操作,此时又不想将监控系统的完整告警功能进行全部关闭,只临时关闭在线升级主机的告警。这就可以使用zabbix的maintenance功能。具体配置方式如下:
创建maintenance的步骤为:登录 zabbix web 页面---- Configuration-----Maintenance ----- create maintenance period ,如下图所示:
第一选项卡配置的是任务名和一个大范围的时间值,其指定了维护所在的磊的时候段在什么范围。maintenance type 指定在维护期间是否仍进行数据搜集。
periods指定的时间段具体的维护时间段,和maintenace中的范围为包含关系。而period type指定了执行的类型,其类型有one time only 一次执行,也有按日、星期或月定期执行 ,如果是后三种方式,date项会变成具体的间隔、开始时间 。无论是何种类型,都有maintenance period length型 ,其指定了具体每次维护的持续时间,如2小时。
hosts groups 项太多内容,就是选择某组主机或某个主机在维护期间不进行告警通知。

mysql主从同步延迟zabbix怎么监控

使用 bcc 工具观测 MySQL:1)dbstat功能:将 MySQL/PostgreSQL 的查询延迟汇总为直方图

语法:

dbstat [-h] [-v] [-p [PID [PID ...]]] [-m THRESHOLD] [-u] [-i INTERVAL]              {mysql,postgres}

选项:

{mysql,postgres}                           # 观测哪种数据库-h, --help                                 # 显示帮助然后退出-v, --verbose                              # 显示BPF程序-p [PID [PID ...]], --pid [PID [PID ...]]  # 要观测的进程号,空格分隔-m THRESHOLD, --threshold THRESHOLD        # 只统计查询延迟比此阈值高的-u, --microseconds                         # 以微秒为时间单位来显示延迟(默认单位:毫秒)-i INTERVAL, --interval INTERVAL           # 打印摘要的时间间隔(单位:秒)

示例:

# 使用 sysbench 在被观测数据库上执行 select[root@liuan tools]# dbstat mysql -p `pidof mysqld` -uTracing database queries for pids 3350 slower than 0 ms...^C[14:42:26]     query latency (us)

2)dbslower

功能:跟踪 MySQL/PostgreSQL 的查询时间高于阈值

语法:

dbslower [-h] [-v] [-p [PID [PID ...]]] [-x PATH] [-m THRESHOLD]                 {mysql,postgres}

参数:

{mysql,postgres}                           # 观测哪种数据库 -h, --help                                 # 显示帮助然后退出 -v, --verbose                              # 显示BPF程序 -p [PID [PID ...]], --pid [PID [PID ...]]  # 要观测的进程号,空格分隔 -m THRESHOLD, --threshold THRESHOLD        # 只统计查询延迟比此阈值高的 -x PATH, --exe PATH                        # 数据库二进制文件的位置

示例:

# 使用sysbench在被观测数据库上执行update_index [root@liuan tools]# dbslower mysql -p `pidof mysqld` -m 2 Tracing database queries for pids 3350 slower than 2 ms... TIME(s)        PID          MS QUERY 1.765087       3350      2.996 UPDATE sbtest1 SET k=k+1 WHERE id=963 3.187147       3350      2.069 UPDATE sbtest1 SET k=k+1 WHERE id=628 5.945987       3350      2.171 UPDATE sbtest1 SET k=k+1 WHERE id=325 7.771761       3350      3.853 UPDATE sbtest1 SET k=k+1 WHERE id=5955. 使用限制

bcc 基于 eBPF 开发(需要 Linux 3.15 及更高版本)。bcc 使用的大部分内容都需要 Linux 4.1 及更高版本。

"bcc.usdt.USDTException: failed to enable probe 'query__start'; a possible cause can be that the probe requires a pid to enable" 需要 MySQL 具备 Dtrace tracepoint。

关于zabbix告警延迟和zabbix停止服务的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 zabbix告警延迟的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于zabbix停止服务、zabbix告警延迟的信息别忘了在本站进行查找喔。
上一篇:负载测试设备(负载测试设备厂家)
下一篇:获取zabbix告警(zabbix触发器配置告警)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~