AIOps 一场颠覆传统运维的盛筵
581
2022-12-13
机器学习算法到底学到了什么?
这些系统的用户需要良好的用户体验。因此,这些复杂系统的部署、运行和维护需要专业的运行维护人员来应对各种突发事件,确保系统的安全可靠运行。因为各种突发事件都会产生大量的数据,从本质上讲,智能运维可以看作是大数据分析的具体场景。
相较于手动运维,自动化运维极大地提升了运维的效率,DevOps提升了研发和运维的配合效率。然而当整个互联网系统的数据规模开始爆炸性增长和服务类型的复杂多样,基于人为指定规则的专家系统遇到了诸多瓶颈,其中很重要的一条是:对于长期从事某行业运行维护工作的专家来说,手工总结重复、可追溯的现象,形成规则,完成自动运行维护是非常必要的。然而,这种基于人工规则的方法并不能解决大规模的运行维护问题。
与依赖人工生成规则的自动操作和维护不同,智能操作和维护强调机器学习算法从海量运维数据中自动学习(包括事件本身和运维人员人工处理日志),完善和总结规则。也就是说,智能运维在自动运维的基础上增加了一个基于机器学习的大脑,它命令监控系统采集大脑决策所需的数据,进行分析、决策,并命令自动脚本执行大脑决策,从而达到系统运行维护的总体目标。
发表评论
暂时没有评论,来抢沙发吧~