睿象云助力中汇支付,打造最佳告警管理实践

作者:小编 发布时间:2021-01-19 阅读:

0015e23c56b454d2778576935e5d4af

客户-中汇银行

中汇支付是独立第三方支付平台,旨在深入 B2C 和 B2B 领域,为行业客户快速准确定制支付解决方案。中汇支付运维总监 王湘 负责着中汇银行运维团队。随着业务的频繁来往,持续响应的系统也亟需良好的维护和修缮,IT 环境的稳定与否,直接决定了销售额度是顺利上涨,还是戛然中停,因此对于中汇银行电子支付团队来说,打造一个百密不疏,坚不可破的告警管理平台,可谓迫在眉睫。


支线繁多的核心业务,动一辄牵连万千

中汇支付在商旅,电子,教育,医疗,税收等方面均开展有关系紧密的核心业务,而这些核心业务均依赖于IT系统的稳定和即时响应性。

传统 IT运维下,对IT系统的维护主要通过接入 zabbix  、Nagios  、Prometheus 等监控工具,运维人员长时间精准密防来观测问题的出现,并对其及时解决,然而一旦问题告警过多,就可能引起多米诺骨牌式的连锁反应,造成运维人员疲于应对的“告警风暴”,特别是像中汇支付如此业务线庞大的企业,动一辄牵连万千。


运维团队面临的问题是:

● 业务线庞大,告警数量繁杂,缺乏有效的统一管理手段

● 运维人员有限,告警的发现和处理效率面临极大挑战

● 重复告警过多,难以精准发现问题根因,十分依赖于运维人员的经验

如果不能及时解决引起 IT 系统故障的肇因,就可能进一步造成大面积的瘫痪,使得业务线在某一时间段内彻底崩溃,让企业的商业利益受到损害。


智能的告警管理平台,行业领先的告警管理机制

通过睿象云开发的 Cloud Alert 智能告警平台(以下简称 Cloud Alert),中汇支付的运维团队成功将监控工具收集的各类告警进行集中录入,统一管理。各类监控系统下监测到的告警能够通过电话通知方式及时提醒到运维团队,使运维人员可以在第一时间内进行处理,扼制住事态的发展趋势。

Cloud Alert 提供的多种通知方式充分满足了运维人员的告警接收需求,平台开发的电话、短信、微信、邮件、钉钉等多元化通知策略,使得运维团队能够灵活接收系统告警,有效安排后续处理。

借助 Cloud Alert ,中汇支付实现了:

● 告警处理的平均响应时间得到了缩减

● 告警风暴的扼制效果有了显著的提升

● 运维人员的工作效率得到了大幅度的提高

我们的告警平均响应时间得到了大幅度减少,这使得我们的运维人员能够更为专注地处理项目的其他事宜,团队的效率得到了明显提升。

如果你的团队能达成低成本,高效率的运维管理,就能让员工将更多的精力投入在业务支持和产品创新上!

—— 中汇支付运维总监 王湘


系统的排班策略,以有限的人员达成更多的可能

中汇支付使用 Cloud Alert 独特的排班策略,将每个小组的人员以小时,日,周的时间段自由分配告警工作,使得每一个阶段的告警通知使命必达;如果排班人员有临时请假,换班,休假等情况,Cloud Alert 还支持临时调整排班,全面支撑系统的告警流程。最优化运维人员的工作效率和工作流程。

借助 Cloud Alert 的排班管理策略,中汇团队实现了:

● 告警的整个处理流程的可调控性及流程化部署

● 运维监控团队的排班可视化,从上到下的透明化

● 接入排班功能的团队提高了工作效率,获得了更多生产力与参与度

运营效率和告警平台稳定性对团队来说至关重要,我们本可以在内部自己打造一些系统,但是交由专业的团队来处理相关业务是更为合适的选择,总体而言,使用 Cloud Alert 为我们带来了更大的价值与收益

——王湘总结道


TAG标签:
立即开启智能告警管理之路
@版权所有 © 四川睿象科技有限公司 - 蜀ICP备19004207号