SkyWalking集成¶
Skywalking是由国内开源爱好者吴晟开源并提交到Apache孵化器的产品,它同时吸收了Zipkin/Pinpoint/CAT的设计思路,支持非侵入式埋点。 是一款基于分布式跟踪的应用程序性能监控系统。
SkyWalking集成CA步骤¶
-
在睿象云Cloud Alert 界面创建SkyWalking应用,并获取 appkey
-
进入SkyWalking配置webhook
-
进入apache-skywalking-apm-bin解压目录下的config,编辑文件alarm-settings.yml,做如下修改,定位到文件底部添加webhook地址,其中rules是程序自带配置,也可以自己修改,如下所示:
service_resp_time_rule: metrics-name: service_resp_time op: ">" threshold: 10 period: 1 count: 1 silence-period: 5 tags: level: WARNING message: Response time of service {name} is more than 1000ms in 3 minutes of last 10 minutes. webhooks: - http://api.aiops.com/alert/api/event/skywalking/{appKey}
-
配置项说明:
标签名称 示意说明 metrics-name 告警指标,指标度量值为long、double或int类型 op 度量值和阈值的比较方式,这里是大于 threshold 阈值,这里是1000,毫秒为单位 period 评估度量标准的时间长度,也就是告警检查周期,分钟为单位 count 累计达到多少次告警值后触发告警 silence-period 忽略相同告警信息的周期,默认与告警检查周期一致。简单来说,就是在触发告警时开始计时N,在N+period时间内保持沉默silence不会再次触发告警, 这和alertmanager的告警抑制类似 message 告警消息主体,通过变量在发送消息时进行自动替换 webhooks 回调地址 -
级别配置要求,如下所示
tags: level: Warning 标签名称 | 示意说明 -------|----- level | Critical、Error 、Warning 、info、Normal
-
重启服务
进入apache-skywalking-apm-bin解压目录下,先关闭服务,再执行以下命令 ./bin/oapService.sh 注意: 观察日志文件./logs/skywalking-oap-server.log
测试SkyWalking告警¶
在SkyWalking的警报中通过警报策略触发告警后,告警会通过webhook地址把告警推送到CloudAlert平台,如果CloudAlert平台没有接收到告警,请联系睿小象进行排查。
SkyWalking与CA告警级别¶
睿象云 | SkyWalking |
---|---|
致命 | Critical |
严重 | Error |
警告 | Warning |
提醒 | info |
通知 | Normal |
睿象云 | SkyWalking |
---|---|
事件ID (eventId) | md5(id0) |