睿象云智能告警平台的分派策略
1041
2023-02-13
本文目录一览:
人工智能经历了六十多年的浮浮沉沉,随着计算算力的进步,算法的创新和互联网发展下的海量数据积累,人工智能技术未来十年将焕发出新的活力,成为最具有冲击力的 科技 发展趋势之一。
在HUAWEI CONNECT 2020期间,华为基于对电信领域的深刻理解和多年经验沉淀,带来了《AIOps使能服务》的分享,旨在结合电信领域应用场景,使能网络达到自动、自愈、自优和自治的自动驾驶网络,提升整个网络的效率,降低OPEX。
AIOps成为电信网络运维智能化转型趋势
随着“5G 新基建”的加速实施,数字经济发展迎来新的动能。不仅推动投资消费的快速成长,还将驱动各行业的数字化转型升级。随之而来的是网络问题复杂化与业务质量高要求的挑战,运维能力的演进成为电信网络能否持续发挥效能的关键因素。
电信网络运维作业正面临问题发现被动(75% 问题由用户发现),故障根因定位难(90% 时间用于问题定位)的业务挑战。同时,各专业运维支撑系统功能也面临开发周期长,闭环流程自动化程度低的技术瓶颈。因此,运营商期望引入AI实现智能运维,做到主动维护和故障自愈。
在运维支撑系统的演进方向上,AIOps(运用AI及大数据技术解决运维问题)已经成为电信行业运维智能化转型的趋势和共识:构建AIOps平台能力,支撑不同运维场景应用。在未来五年内,电信行业市场的运维系统和平台将加速AI能力的升级,成为电信领域AI应用的核心场景,投资占比达到60%。
因此,AIOps已经成为电信网络运维智能化转型趋势。通过构建电信领域AIOps平台能力,快速实现智能运维升级。
华为AIOps助力网络提升可靠性及使能智能化运维
按照自动驾驶网络的等级定义,运维的智能化目标是要实现全域、全流程的预测性运维,自动监控、定位、自愈。
华为AIOps使能服务作为自动驾驶网络AI引擎NAIE的核心能力,基于AI平台,提供了一系列的电信领域AIOps原子能力以及组合编排能力,使能网络管控析单元、智能运维解决方案等运维系统,最终帮助运营商打破原有的烟囱式建设方式,将各专业运维系统的应用与AI能力解耦,采用分层的服务化架构对接共享数据中心,集中提供AIOps能力,适配运维场景应用百花齐放的需求。
如下是华为AIOps使能服务预组合编排好的服务,可开箱即用:
kpi异常检测服务, 快速智能识别海量kpi/kqi的异常情况,广泛应用在网络性能和质量监控场景;
故障识别与根因定位服务, 根据海量告警结合对应网络拓扑和传播知识,实时识别故障及根因网元及告警,可自动学习知识规律,保证持续优化,可广泛应用在各种网络场景;
日志异常检测服务, 实现日志的自动分类和统计规律发掘,实时监控出系统的异常行为和相关日志,可广泛应用在IT及电信网络场景;
硬盘异常预测, 可智能预测短期内(14天)的硬盘故障,以采取规避预防措施,以免对业务产生影响,广泛支持主流厂商的HDD及SSD型号。
细数华为AIOps使能服务四大核心竞争力
提供丰富的AIOps原子能力: AIOps的原子能力覆盖运维全流程,包括预测、检测,定位、执行。原子能力库支持流量预测,故障预测,KPI异常检测,日志异常检测,CHR异常检测,异常关联分析,事件聚合,根因定位等20+原子能力。
作为电信领域的AIOps使能服务,具备两个核心特点:一是基于华为电信领域的经验,原子能力将AI算法与电信领域行业知识融合,预制了默认的电信领域模型参数,同时支持现网运行态的调优,解决当前通用算法模型在具体行业落地效果差的难题。目前,已经在现网得到了规模验证。
另一个是AIOps原子能力采用标准化模型规范,统一数据输入,参数配置,结果输出等接口。为AIOps单点原子能力到灵活的组合串接提供了基础。
组合编排与DevOps能力: 通过组合编排功能,使用者可选择业务场景所需的AIOps原子能力,通过可视化方式完成流程串接,并进行业务泛化参数配置,包括数据接入方式,模型参数,内置电信领域泛化参数,事件通知方式、可视化Dashboard等配置。上述能力支持可视化编排或接口调用方式实现。此外,基于NAIE平台训练服务,AIOps的原子能力库支持使用者根据实际业务需求开展算法模型的创新与开发,不断扩展AIOps能力。NAIE的生态服务也提供专业的人员培训赋能。
支持电信领域数据对接: 支持KPI、告警、日志、xDR等电信领域主流运维数据。支持Kafka,数据库,文件系统,Restful等电信运维系统的主流数据对接方式。AIOps使能服务提供通用的数据源对接和标准化数据治理组件,通过配置项快速建立与运维系统的数据源连接,通过SDK将不同的数据类型和格式治理成标准化的AIOps原子能力输入集,用于模型训练和推理。
场景组合服务: 围绕运维全流程(发现、分析、处理)提供预制典型场景组合应用,快速接入运维流程。
综上所述,华为AIOps使能服务作为智能运维AI能力引擎,融合AI的技术优势与华为在电信领域的专业优势,为运维系统的智能化演进提供AIOps平台能力支持,助力到各专业运维系统的应用快速上线,让运维专家专注场景应用设计和业务目标达成。
华为AIOps助力运营商及企业网络打造最佳实践
在KPI异常检测方面,电信网络中,通过KPI来预测和检测网络问题是最普遍的场景。通过AI算法基于 历史 数据自动生成每个KPI的动态门限,避免传统静态门限带来的误报和漏报。
华为NAIE融合了电信领域的运维业务特点,提供单指标/多指标检测,异常原因关联分析,模型的自学习调优等关键能力。目前已经用在核心网,无线,数通等不同业务领域。国内某运营商采用了核心网KPI异常检测服务以后,实现提前5小时识别异常并主动预警,降低了业务损失。
在告警根因定位方面,发现异常或者故障之后的定位是运维流程中的难点,如何准确的将多维度的异常、告警等事件进行汇聚,减少故障噪声,准确定位到具体原因?这些工作目前主要依赖专家经验或者手工分析,而且受限于分析算力和知识信息,效果并不好。
华为NAIE AIOps通过AI算法与业务的融合,支持多类异常/告警等事件的智能故障定位,自动实现时间,拓扑和故障传播图等维度的事件汇聚和根因定位。目前已经应用到无线接入网等业务领域,经过实际验证,无效上站减少60%,根因识别准确率85%+,运维效率整体提升15%。
写在最后,电信领域AIOps落地的关键是需要将行业知识与AI技术融合。网络运维系统的AIOps能力构建的趋势是业务与能力解耦,做到AIOps能力的复用、拉通,支持,适配运维场景应用百花齐放和快速上线迭代的需求。
因此,AIOps使能服务作为智能运维AI能力引擎,融合AI的技术优势与华为在电信领域的专业优势,为运维系统的智能化演进提供AIOps平台能力支持,助力到各专业运维系统的应用快速上线,让运维专家专注场景应用设计和业务目标达成。目前,华为AIOps使能服务已经在无线,核心网,数通等网络域得到了广泛的应用。
AIOps如何落地,还是以具体案例来说比较容易理解。就拿擎创为北京农村商业银行做的项目来说。
项目背景:
近年来数字化转型的步伐愈发变快,随着北京农村商业银行业务规模的扩增以及业务形式的电子化加速,贯穿业务、市场、系统、应用、数据库、中间件、网络、安全等多方面的数据量迅速叠加堆积。然而,这些对于市场而言极具价值的巨量化数据并不集中,它们分散在银行的各中心服务器或设备之中,这使得银行的数据运维工作量越来越大,尤其是在日志的统一管理、监控、信息挖掘等方面极为明显。因此,北京农村商业银行对于信息技术提升和数据管理加强的需求日益加深。
根据监管部门对银行数据治理的相关指引以及中国银监会《商业银行信息科技风险管理指引》(银监发〔2009〕19号)中针对日志文件完整性、存留周期的相关要求,北京农村商业银行最终选择擎创科技助力其完善智能运维建设,保障其业务的平稳高效运行。
解决方案:
根据北京农村商业银行的需求以及现状,擎创科技通过以下手段为其建设运维大数据平台。
通过现分布式高可用,支持横向扩展,随着业务需要随时扩容平台节点;
通过高效数据采集手段,实现对现有IT环境的实时数据采集,打破各个孤立运维工具中的数据孤岛;
对所有运维数据进行集中高效的存储、查询及可视化展示;
支持结构化、非结构化的数据采集支撑;
内置AI智能日志分析引擎,实现日志异常检测、日志异常定位并辅助故障定位。
平台架构图如下:
创新点:
北京农村商业银行在运维大数据平台项目的建设中,采用流批一体的处理技术、流式窗口聚合方式,实现了实时采集、秒级处理、秒级查询,为运维人员提供高效的数据查询手段,为应用人员实现交易数据与日志的深度结合;
采用智能算法判断、故障根因定位,为运维人员提供便捷数据分析工具。充分挖掘了北京农村商业银行的运维数据价值、提升了运维管理水平、提高了运维效率。
建设成效:
建设日志治理平台和大数据平台,实现日志数据统一集中管理、KPI动态异常检测、日志智能聚类等功能。
日志治理+大数据平台(算法),当前日增日志6TB,设计容量10TB,热数据保存30天、冷数据保存3个月,大数据平台日志存档一年、指标类数据两年;
最高峰每秒处理日志500万条日志,其中最高按单笔业务交易日志行数达3000+行,经采集、数据提取、数据合并、数据丰富等数据处理后延时小于1s。
总结:
随着运维大数据平台的建设完成,北京农村商业银行实现了对各类运维日志数据的统一管理,能够对日志进行集中查询、聚类分析、快速分析、精细化分析等操作,结合监控告警的智能化处理,可以做到事前智能预警、事后快速定位故障并分析,进一步提升了银行数据中心的运维管理水平。
从全云网络到意图驱动的智简网络(Intent-Driven Network, 简称IDN),华为致力于不断释放网络的价值。就像华为交换机与企业网关产品线总裁钟开生多次所强调的,网络应该打通与商业之间的鸿沟,才能为业务和商业策略服务,这也就是华为推出IDN的初衷。
平安科技与华为签署智简网络联合创新合作协议现场
让网络为企业创造充满想象的商业价值,这样的愿景同样符合平安科技对网络的定位与需求,基于同样的理念与目标,在刚刚过去的2018年华为全球分析师大会上,平安科技与华为正式签署联合创新合作协议,致力于意图驱动的智简网络联合创新,促进金融行业数字化转型。
平安科技首席技术官兼总架构师方国伟对双方未来更深入的合作充满期待,他表示:“联合创新是迎接未来挑战的关键,我们希望抓住互联网+的机遇,提升平安用户的体验,促进‘科技引领金融,金融服务生活’。本次协议的签署,我们深化了与华为的合作,将通过更丰富的智简网络联合创新实践,加速金融行业数字化转型,并为实现平安云以及智慧城市的商业战略打下良好的基础。”
构建以用户体验为中心的企业数字化网络
通过引入人工智能(AI)、大数据(Big Data)与云计算(Cloud)技术,简称之“ABC”技术,IDN能够实现以网络为中心转变成为以用户为中心,进而可以基于此在商业和网络之间搭建一座桥梁,建立基础网络设施的数字孪生网络平台。它对上接收商业意图,对下通过意图驱动的自动化作用于网络基础设施,脱离以设备中心为中心的传统网络,IDN能够真正实现以“人”为中心,并且是以业务驱动。
在智简网络联合创新合作协议签署仪式上,平安科技首席技术官兼总架构师方国伟以华为SD-WAN智简互联专线方案帮助平安快速上线寿险AI业务为例,说明了IDN为业务创新释放出的商业价值。平安首次在业内推出AI客服,采用人脸、声纹等生物认证技术和大数据匹配,远程核实客户身份信息,实现“在线一次性业务办理”。方国伟表示,当前华为SD-WAN已经成功为平安科技快速交付首期200个站点,为AI客服业务提供了最优链路保障、最优座席体验,保险出单效率从之前的每单2小时提升到1分钟。
除了围绕SD-WAN的分支互联场景,双方进行的智简网络联合创新还涵盖了企业园区、数据中心、网络安全等基础网络建设场景,据介绍,数据中心和企业园区领域已经启动了联合创新项目。
深入行业应用场景 最大化智简网络价值
当然,站在华为的角度,与平安科技进行智简网络联合创新,这有利于IDN深入行业应用场景,最大化网络价值,毕竟它的目的就是要结合业务为支撑商业意图服务。正如钟开生所说,“联合创新能够帮助华为更好地理解金融客户的行业场景、贴近客户业务,使智简网络解决方案在商用部署中迭代增强。可以说,我们成就了客户,更是客户成就了我们。”
钟开生介绍,华为正在将IDN架构落地到这些场景,如园区、数据中心、广域网和安全等领域。
在园区领域,华为在上个月举办的2018华为西欧渠道大会上正式发布了意图驱动的企业园区网络CloudCampus解决方案,以用户为中心,通过智简网络实现每用户每应用每时刻的体验可视、可预测、可管理,在运维方面通过云管理实现简化运维。
在数据中心领域,华为CloudFabric智简云数据中心网络以应用为中心,采用多云统一架构,全网全流可视,风险主动预测,智能化保证业务意图达成。
在企业互联场景,华为基于“应用意图和业务质量”为企业和服务商提供SD-WAN解决方案,保障应用连接体验,最大化链路效率。
在安全领域,华为发布了SDSec解决方案,实现基于“业务和威胁意图”的全网主动防御系统。并且华为在方案中引入AI和安全控制器SecoManager,统一安全业务编排与管理,从而让网络与安全深度协同,实现威胁检测、处置的自动闭环,抵御未知威胁。
再次焕发网络活力 建立开放生态
在今年2月的巴塞罗那世界移动大会上,华为正式发布了意图驱动的智简网络方案。的确,意图驱动的网络不是新瓶装旧酒,它在SDN网络和云化网络之上加入了新的商业逻辑和技术模块。例如钟开生多次谈到的IDN的核心大脑:意图引擎、自动化引擎、分析引擎、智能引擎等等。
以设备为中心变为以用户为中心、从被动响应到主动预测、从技术依赖到人工智能与智能化、从封闭架构到开放平台,IDN相对传统网络做出了诸多关键的改变。
智简网络具有智慧、极简、超宽、开放和安全5大关键特征,通过这5大关键特征,智简网络能够为企业客户带来:新业务上线时间缩短、网络运维OPEX降低、网络故障解决效率提高、接入能力全面提升以及最重要的商业收益增加。钟开生以“智慧”特征举例说,华为发布的数据中心智能运维方案FabricInsight,基于芯片级的Telemetry和交换机内嵌智能技术,应用与网络智能关联,实现秒级的故障检测、分钟级的故障定位和恢复。在某银行的一次故障演练中,故障恢复时间从76分钟降低到29分钟,业务损失降低68%。
在IDN的架构中,华为再次强调了开放的价值。IDN提供了丰富的接口,包括大数据的平台接口(如Kafka),北向跟传统OSS的对接(如传统的CORBA),部分跟云平台对接(如Restful),以及面向南向的接口(如传统的SNMP,新的Netconf/Yang、Telemetry)等等。
而且,智简网络还是一个面向行业开放生态平台,提供了丰富的API接口、开发编程工具以及已经验证通过的行业应用等。“IDN致力于为用户打造丰富的应用生态系统,开放的架构将会使网络更智能。”钟开生说,网络唯有将数据的价值开放,才能真正的被业务所驱动。
根据艾瑞咨询数据显示,2021年中国IT服务将突破万亿大关,其中,IT运维市场规模在2021年达到2941.2亿元,预计2023 年达到3236.4 亿元,2020-2023 年的年复合增长率为 11.7%。
同时,根据IDC和智研咨询数据等平台公开数据显示,从2018年至2022年,全球ITOM行业市场规模将以8.58%的年均复合增长率高速增长,预计到2022年ITOM市场规模将达392.98亿美元。其中,中国ITOM市场在2020-2023年的年复合增长率为10.7%,到2023年市场规模将达到165.7亿元。
目前规模最大的赛道是ITOM,ITOM属于传统运维,随着发展以数据为核心的运维分析出现,演变成ITOA,后来又提出了智能化运维(AIOps),目前肯定还是ITOM占市场的主体。举个例子,如果中国购买ITOM相关软件的企业有1万家,那么市场上购买ITOA的只有500~1000家,后者市场渗透率不足10%。不过ITOA、AIOps会是未来增长最快的两个方向。
当下的IT运维市场中有两种主流的商业模式,一种是从单点同质化的产品走向全栈一体化解决方案,一种是聚焦单一产品或赛道,做专、做精。擎创科技属于后者。因为智能运维这一领域的产品需要长时间的技术积累,以及在高质量用户处落地实践总结经验,才能够成就市场认可的产品,并不是一朝一夕就能完成。另外,随着云原生的发展,IT运维在云端的落地也越来越多。现在,IT运维的发展正处于螺旋式的上升期,根据Gartner预测未来3-5年内,可观测的智能运维能够达到成熟期。
擎创科技,作为国内首批智能运维领域的解决方案提供商,将持续锚定赛道,用心服务用户,不断根据落地反馈来优化升级解决方案,助力客户完成从传统运维到智能运维的转变,也希望真正的智慧运营能够早日到来。
关于网络智能运维解决方案开发和智能运维技术的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 网络智能运维解决方案开发的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于智能运维技术、网络智能运维解决方案开发的信息别忘了在本站进行查找喔。发表评论
暂时没有评论,来抢沙发吧~