AIOps 一场颠覆传统运维的盛筵
834
2022-09-20
如何监控业务的响应速度?Cloud Insight SDK 实践分享(提高服务响应速度的手段)
下面介绍一个业务场景的监控,本实例来自真实用户场景。
用户需求
监控可用性和响应速度,运营的需求要求每次接口响应控制在0.1-0.5s内。如果超出这个时间就要找到问题,进行优化。
以前的做法
现在的监控手段
配置
通过 Cloud Insight SDK 采集数据,通过探针发送这些数据到后端服务器,后端服务器对数据进行处理,进行展示。
#获取Nginx Upstream response time* * * * * for i in $(seq 3); do sleep 15; python /opt/ci_check_php_response_time.py; done
部署好后,可以在自定义数据仪表盘上看到应用数据。把这些自定义数据放在一张仪表盘上,后期可以直接打开这个自定义仪表盘来查看 php 的响应情况,即使是多个不同服务器中的 nginx 消息也都可以放在一张图表上,效果如下图:
这样仪表盘是配置完了,其实还可以设置报警策略,在一些指标超出范围时触发报警。
查看
依照平时使用习惯,进入监控界面,首先第一眼就是各个平台概览,看看是不是都在正常运行,正常情况下图标都应该是绿色的,如果变成红色了就点进去看看,上面会有相应报错。
上述平台如果没有问题,就进入仪表盘页面,首先左面是自定义仪表盘,在这就可以查看之前配置的 php 的响应情况,右面是平台仪表盘,一般你系统监控上什么就会自动出现相应的组件信息。
延伸
总结
监控服务器,简单,一键安装监控数据库等组件,简单,修改配置文件,重启探针监控业务数据,依旧简单,使用 SDK
简单列几个有意思的 SDK 监控应用:
参考文档:
发表评论
暂时没有评论,来抢沙发吧~