如何在智能告警平台CA触发测试告警
923
2022-10-04
新时期系统级专业运维平台如何配合压力测试
某财政厅用户拟组织开展新版预算一体化业务系统的全面压力测试工作,由全省编制单位近30000名用户在指定时间段执行相关业务模块。该客户多年以来一直由海天起点提供数据库及中间件的技术支持服务。海天起点使用自主知识产权的Ankole运维监控平台软件,将涉及压测的所有硬件及数据库等系统软件对象纳入管控,以便保障压测期间,指标异常及时报警、准确定位问题、性能数据能回溯分析,为本次压测保驾护航。
12月3日上午9:30,压力测试如期开展。压力测试过程中,通过Ankole数据库实例实时性能指标情况,准确的反映了:随着用户数量的上升,物理读写较高,IO响应时间上升明显,特别是log file sync响应时间超过了20ms,成为系统性能的主要瓶颈。
如图:
在Ankole的主机性能指标面板中,各磁盘的IO量、响应时间一目了然。部分数据盘链路使用率已达到100%,根据线索,现场支撑人员将严重影响性能的服务会话kill后,磁盘响应时间恢复正常。
接下来我们需要定位影响性能的低效SQL有哪些,通过Ankole的 AWRSQL分析页面,醒目标示出了问题SQL(SQLID:50bxdnrkfnv42),与开发人员确认,该语句为核算服务对应的SQL。
如下图
查看历史,获得数据库各项指标历史数据曲线图,查看各项指标的变化趋势:
在压测的另一个场景中,采购服务响应缓慢,在Ankole的“活跃会话”面板显示有大量的锁等待,进一步可以方便追踪到造成这些锁等待的应用、机器及SQL。
如下图:
当天, 在Ankole运维平台的助力下,我们既在第一时间发现问题,同时又能对问题的原因进行分析,给相关厂商提供线索,这为此次压测圆满完成,提供非常大的帮助。从而得到客户、应用厂商的一致认可。
发表评论
暂时没有评论,来抢沙发吧~