跳转至

SkyWalking集成

Skywalking是由国内开源爱好者吴晟开源并提交到Apache孵化器的产品,它同时吸收了Zipkin/Pinpoint/CAT的设计思路,支持非侵入式埋点。 是一款基于分布式跟踪的应用程序性能监控系统。


SkyWalking集成CA步骤

  1. 睿象云Cloud Alert 界面创建SkyWalking应用,并获取 appkey

  2. 进入SkyWalking配置webhook

  3. 进入apache-skywalking-apm-bin解压目录下的config,编辑文件alarm-settings.yml,做如下修改,定位到文件底部添加webhook地址,其中rules是程序自带配置,也可以自己修改,如下所示:

        service_resp_time_rule:
            metrics-name: service_resp_time
    
           op: ">"
    
           threshold: 10
    
           period: 1
    
           count: 1
    
           silence-period: 5
    
           tags:
    
             level: WARNING
    
           message: Response time of service {name} is more than 1000ms in 3 minutes of last 10 minutes.
    
        webhooks:
             - http://api.aiops.com/alert/api/event/skywalking/{appKey}
    
  4. 配置项说明:

    标签名称 示意说明
    metrics-name 告警指标,指标度量值为long、double或int类型
    op 度量值和阈值的比较方式,这里是大于
    threshold 阈值,这里是1000,毫秒为单位
    period 评估度量标准的时间长度,也就是告警检查周期,分钟为单位
    count 累计达到多少次告警值后触发告警
    silence-period 忽略相同告警信息的周期,默认与告警检查周期一致。简单来说,就是在触发告警时开始计时N,在N+period时间内保持沉默silence不会再次触发告警, 这和alertmanager的告警抑制类似
    message 告警消息主体,通过变量在发送消息时进行自动替换
    webhooks 回调地址
  5. 级别配置要求,如下所示

    tags:
      level: Warning
    
     标签名称   |   示意说明
      -------|-----
      level |   Critical、Error 、Warning 、info、Normal
    
  6. 重启服务

    进入apache-skywalking-apm-bin解压目录下,先关闭服务,再执行以下命令
    
    ./bin/oapService.sh
    
    注意: 观察日志文件./logs/skywalking-oap-server.log
    

测试SkyWalking告警

在SkyWalking的警报中通过警报策略触发告警后,告警会通过webhook地址把告警推送到CloudAlert平台,如果CloudAlert平台没有接收到告警,请联系睿小象进行排查。


SkyWalking与CA告警级别

睿象云 SkyWalking
致命 Critical
严重 Error
警告 Warning
提醒 info
通知 Normal
睿象云 SkyWalking
事件ID (eventId) md5(id0)