告警通知变得轻松便捷——微信告警接口指南
757
2023-03-23
+AI,智简云化核心网运维
近日在荷兰海牙举行的SDN NFV世界峰会上,华为云核心网硅谷NFV能力中心首席规划师沈洁,向全球领先运营商、解决方案提供商、行业组织、咨询公司的决策者与专家分享了对于未来网络运维系统设计的思考,着重介绍了华为运用机器学习技术解决云化核心网日常运维场景中静默故障问题的预测、根因分析等创新实践。
核心网产品范围包括从无线接入后的所有管道和话音交换等设备,网元种类多,相互之间的接口和信令交互复杂多样。一个典型的VoLTE系统,涉及40多个逻辑网元、60多个接口,KPI数量多达30000。云化后,系统分层解耦变得更加复杂,潜在的故障点更多,需要监控的KPI数量更多,运维的难度指数级增加。从实际案例分析,一些棘手的故障问题难于用传统手段检测和发现,比如静默故障,其特点是系统关键KPI指标无异常,事故爆发突然,不能快速定界定位,造成大面积业务受损。
沈洁表示:
华为云化核心网智能运维解决方案将机器学习与专业知识有机结合,通过全量KPI动态偏差计算与根因分析快速识别各类静默故障,变‘事后运维’为‘事先预测’,大幅提升运维效率和网络可靠性。”
沈洁在SDN NFV世界峰会上进行主题分享
全量KPI动态偏差计算:运用实时流数据处理技术,采集和预处理大量的KPI及metric指标,学习其内在变化规律,为每一个KPI及metric训练出对应的动态异常检测模型。该模型具有良好的通用性,能根据输入KPI的特点,合理计算KPI数据在季节性、周期性、变点、节假日、重大事件等不同场景中的有效偏差,降低误判和漏判,准确检测出异常。
基于专家经验系统的根因分析:在探测出异常以后,系统将基于专业领域知识与皮尔松关联、随机森林等机器学习算法的深度结合生成的决策树,对多个异常KPI进行关联分析,给出根因 KPI排序推荐,有效降低定位定界难度,实现故障快速定位。
在涉及50个IMS网元,90个EPC网元商用VOLTE网络中对智能化运维解决方案的验证显示,基于全量KPI动态偏差计算与根因分析的智能运维解决方案异常检测准确度可达85%,且90%故障可自动快速完成定界。
目前,华为云核心网在全球正式商用100多张云化网络,多个网络服务千万用户。未来,华为云核心网将持续创新,不断深化自动化和AI技术的应用,实现核心网络运维效率的倍增,打造“永不故障”的自治网络。
发表评论
暂时没有评论,来抢沙发吧~