大数据时代智能运维（大数据自动化运维）

来源网友投稿 873 2022-12-25

本站部分文章、图片属于网络上可搜索到的公开信息，均用于学习和交流用途，不能代表睿象云的观点、立场或意见。我们接受网民的监督，如发现任何违法内容或侵犯了您的权益，请第一时间联系小编邮箱jiasou666@gmail.com 处理。

本篇文章给大家谈谈大数据时代智能运维，以及大数据自动化运维对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。今天给各位分享大数据时代智能运维的知识，其中也会对大数据自动化运维进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、智能运维服务都有哪些功能以及效果呢？
2、大数据时代数据中心运维管理
3、大数据时代，为风电运维带来哪些机遇
4、大数据时代下的安全运维服务如何实现？
5、互联网时代的网络自动化运维

智能运维服务都有哪些功能以及效果呢？

智能运维是一种全新的数字化运维能力，且是企业数字化转型的必备能力。智能运维的本质是提升运维数据的认知能力，它在提升运维数据治理能力、优化企业业务数字化风险、降低运维人力成本和提升运维在业务侧的影响力方面都有本质的提升。

智能运维，又称AIOps（Artficial Intelligence for Operations），是一种将大数据、人工智能或机器学习技术赋能传统IT运维管理的平台（技术）。

比如以我们公司的夏洛克AIOps智慧运营平台为例。它能以全局运营视角解读IT运维，在AI算法平台的支撑下实现包括精准告警、异常检测、根因定位和容量分析等场景，助力企业数字化业务高效、稳定和顺畅运行。

运维数据治理。通过高性能实时处理的数据平台广泛采集、处理和分析数字化业务运行过程中的多样化运维数据，包括告警、指标、日志、配置以及运维工单等类别，不仅提升了运维大数据的治理能力，优化了数据质量，而且为进一步激活运维数据的价值打下了良好基础；

业务数字化风险。使运维人员不仅提升了历史运维数据的分析能力并且能够对实时数据进行异常检测和问题预判，有效降低数字化业务的运行风险，提升可用性、稳定性；

运维人力成本。使真正意义上的跨域根因定位成为可能，降低对专业运维人员经验技能的依赖，迅速缩短故障排查时间并有效降低人力成本；

业务侧影响力。以业务视角利用多元化数据提高运营分析和决策能力，比如端到端的分析业务交易状态，提供给业务、客服部门及时反馈和决策支持依据，充分增强业务影响力；

智能运维发展正如火如荼，Gartner预见其为下一代运维，认为到2022年将有近50%的企业用户部署智能运维。虽然目前不少企业已经在积极投入建设，也还有一些企业处在迷茫阶段，尽早布局才能在数字化时代不会被淘汰。

大数据时代数据中心运维管理

立足数据中心运维管理的现状，顺应时代发展的潮流，充分利用信息技术的机遇，利用现有资源对数据中心的运维管理加强完善和创新，为行业的发展，国家的进步贡献力量。

1.大数据时代数据中心运维管理的现状

大数据时代作为时代发展的机遇出现在大众视野，但是也是作为挑战逐步渗透在行业的数据中心运维管理中。以计算机技术为依托的数据中心运维管理的显著特点就是大规模的数据流量，正在不断与原有的数据中心架构产生冲突。

目前，大数据时代的数据中心运维管理的先进意识已经深入人心，但是实际项目操作过程中会有众多的问题出现。因为在磨合期，所以现有设备不能满足大数据时代的数据中心管理要求;运维管理人员的没有经过大数据时代新的运维管理思路的熏陶，技术水平与之不匹配;还有就是数据中心的运维管理制度不都完善，相应的管理水平不高。

2.解决数据中心运维管理困境的策略

针对目前数据中心运维管理的困境，本文提出了相应的解决策略，以供业界参考。

2.1 提升运维管理人员的整体能力

基于目前数据中心运维管理工作人员的实际能力，通过采取以下积极的措施来提升运维管理工作人员的综合能力水平。

2.1.1 大数据背景下，强化数据中心运维管理人员的技术应用水平

通过多维度的检验途径，比如定期检查该技术的理论与实践水平确定工作人员的当前能力，在制定符合目前技术短板的相关培训，从而保证运维管理工作的顺利进行。

2.1.2 加强管理方面的知识渗透

在加强数据中心运维管理人员的技术应用水平的前提下，可以加强管理学知识的渗透，为技术团队的整体语言表达能力的提升以及为管理层储备后续力量，既懂技术又懂管理的新世纪人才，有助于数据中心运维管理工作更加高质量的完成。

2.1.3 加强工作人员执行力，更高效的完成工作

在数据中心运维管理的众多评价标准中，执行力是影响一个团队整体运作能力很重要的一个指标，良好的执行力可以保证时间段内的工作目标提前完成或者超量完成。

2.2 强化业务管理工作和业务培训工作

现如今，科学技术的更新速度往往超出人们的接受速度，在数据中心运维管理这个领域也同样适用。所以使得运维管理人员刚刚熟练掌握新的运维既能并熟练应用，新的技术又刷新了行业应用领域。所以设立专门的培训机构，强化管理人员终身学习的意识，紧跟时代发展的脚步。

2.2.1 制定合理的业务培训和业务管理培训计划

科学合理的方案总能给与人们正确的指导，并保证在规定期限内达到既定目标。运维管理培训和业务培训的内容要与时俱进，不断为管理人员灌输新的知识，为运维管理的工作融入新鲜的血液。

2.2.2 合理安排培训时间

运维工作人员在企业内是员工，男性员工在家庭里是儿子，是丈夫，是爸爸，所以要协调好培训的时间，保证员工能充分解决员工之外的各种事情，全身心的投入工作。

2.2.3 使业务管理和业务培训的形式呈现多元化

公司管理层应加强与行业内部个组织间的联系，比如同专业的大学、同行业资深专家、专业讲座等等。通过多元形式的学习加深对行业发展的了解，并积极促进管理人员的专业素养。

2.2.4 定期进行培训效果的考核

在定期进行学习之余，为检验学习效果是否达到预期目标，应适时进行检验，进一步促进运维工作人员的学习质量的提升，提升其主观学习的动力。

总之，强化对运维工作人员的业务培训，能够有效地对运维工作者的维修技术进行与时俱进的培训，能够有利于运维管理工作人员进行数据中心运维管理工作的开展，最终有利于信息技术飞速发展下的运维工作的稳定进行。

2.3 加强了解整体行业环境的意识

有些企业的运维管理的硬件设施和软件配备欠缺，造成整体的管理水平低，是因为企业没有采取相应的举措保障。以下将详细讲述如何提升整体行业环境的了解。

（2）定期组织团队中的成员进行行业发展前景的探讨，在探讨交流的过程中了解当下运维管理工作的总趋势，从而能够为运维工作的有效进行提供有价值的参考意见。

总之，强化了解和分析业务环境的意识，能够有利于运维管理工作人员有行业的危机意识和行业的发展意识以及个人职业规划意识的提升，最终有利于大数据时代数据中心运维管理工作的顺利开展。

3.大数据时代下，技术层面面临的挑战

3.1动力环境监控系统概述

通过应用数据采集系统，计算机和网络技术，逐步完成数据中心运维管理动力电源供电设备的运行和机房的监控的平台就是数据中心动力环境监控系统。

3.2 动力环境监控数据的特点。

通过采集数据中心的关键指标数据，针对实际运行情况实现预警功能、远程功能以及运行监测功能。动力环境监控数据具有其本身特点。

3.2.1 数据结构化、格式化程度高

因系统采集到的实时监控数据大都存储于数据库中，因而动环监控数据结构化、格式化程度高，这也为数据挖掘提供了便利。

3.2.2 实时更新

动力环境监控系统运行的最底保证便是数据的准确性和实时更新，其数据采集的更新时间间隔为每秒。

3.2.3 时序性

动力环境监控系统实时记录的环境温度、环境湿度等数据都是随时间更替而进行采集的。

3.3 数据挖掘提高告警信息准确性

动力监控系统是以计算机为载体，以信息技术为依托的技术，所以其产生的大规模数据也是大数据时代一个突出的特点。就目前而言大规模的数量利用率较低，即使专业水准较高的管理人员也会深感难度高、工作量大，与现有的技术水平不能完好对接。

数据挖掘技术的出现解决了目前的难题。数据挖掘中关联分析方法解决了数据中心运维管理中不明原因的重复警报，为运维管理的工作有序进行提供了基础，并为专业水平较低的运维人员提升了工作效率。

3.3 运维经验知识化的工作模式需要改进

据以往的运维工作人员的叙述，过度依赖专家给与的指导经验，成为行业内部的不良风气。首先运维专家的培养周期较长，短时间没有任何效益输出;其次专家的意见偶尔会带有强烈的主管色彩，但是对于实际操作过程并不适用，最终导致工作的延误;最后就是过度依赖专家，若运维专家不在职装天下将会对运维管理工作造成重创，不具有可持续性。

所以建立关于数据中心运维管理的内部数据和外部数据，为现有的运维人员过度依赖专家的不良习惯提出解决方案。内部数据主要是指内部运维经验;外部数据是指来源于互联网的运维知识。对于收集到的内外部数据，利用文本挖掘、聚类、分类预测等方法对信息进行加工展现，转化成知识库中的知识，并实现对信息的快速、自动化检索。

3.4 资源调度成为容量管理的关键

在大数据时代下，数据中心存储容量指标是指机位空间指标等，尤其是计算资源指标，是其组成的关键部分。需要最新的数据中心运维管理平台实现监测服务器、使用网络以及存储资源等功能，根据实际情况进行管理策略的变动和资源的优化配置。

云计算技术已成为数据中心运维管理的核心，并打破传统的数据运维管理信息系统结构，建立一个全新的集计算、存储、和网络三维一体的虚拟资源库，通过实际的操作，实现现有资源的动态优化配置。

虚拟化技术可以保证存储环节中大规模数据的安全性，在逐步实现数据资源的重复使用、关联以及动态管理等动能的同时，也为运维管理人员提出了巨大的挑战。故此，通过科学合理的分析容量数据，构建完善的资源调度制度，实现实现新一代数据中心资源在应用间的动态分配，将成为大数据时代下数据中心运维管理的一大挑战。

4.结束语

为顺应大数据时代的潮流，必须进行数据中心运维管理的深度优化，为数据中心的整体发展提供新鲜的科技动力。通过提升运维管理人员各方面的能力还有利用先进的动力环境监控系统技术，为数据中心的运维管理提供强大的人力支持和技术支持，助力大数据时代背景下，数据中心运维管理的长足发展。

参考文献

[1]朱玉立，任义延，高甲子等，浅谈大数据时代下的数据中心运维管理[J].信息系.统工程，2015.

[2]解林超，石佳，王仲锋等。大数据时代对传统数据中心的影响及思考[J].中国新通信，2014.

[3]周焘。大数据时代的档案大编研[J].陕西档案，2014.

[4]陈艺高，动环大数据，提升运维效能[J].通信电源技术，2014.

[5]张隽轩，张文利，黄毅。数据中心运维系统应用ITIL管理体系分析[J].智能建筑与城市信息，2015.

[6]宋维佳，马皓，肖臻，张晓军，张蓓.虚拟化数据中心资源调度研究[J].广西大学学报：自然科学版，2011，36（01）：330-334.

大数据时代，为风电运维带来哪些机遇

实现智能化风场大数据时代智能运维，建立地区运维中心，实现风电场无人值守大数据时代智能运维的美好大数据时代智能运维的未来。。
放心，现在连一些基本大数据时代智能运维的数据采集问题都没解决，大数据云平台智能化之类的虽然是发展趋势，但是暂时都是纸上谈兵。工业4.0虽好，但是行业连工业3.0都没有解决。
顺道鄙视下整天拿这些东西搞宣传不干实事的某些风机厂家。

大数据时代智能运维（大数据自动化运维）

大数据时代下的安全运维服务如何实现？

随着信息化建设的逐步完善，有绝大多数行业的用户都将业务系统建立在网络应用的基础之上。而互联网应用与业务的融合为用户带来了巨大的效率提升和持续的竞争力。但近两年因遭受互联网攻击而导致的经济损失非常巨大，并呈现出逐年增加的趋势，安全问题已经成为危害中国互联网健康发展的罪魁祸首之一，任何细微的安全问题，都有可能导致政企的互联网应用系统遭到严重威胁。如果说过去我们反复强调政企用户应在互联网安全领域中居安思危，这里所谓的“安”是用户尚未遇到重大安全事件，或者已经遭受攻击或侵害但自己不得而知，那么近期“凌镜门”事件无疑给全世界互联网信息安全“狠狠的一巴掌”。值得注意的是，传统的防病毒、防入侵检测更偏向于监测，如何采用新的安全策略应对多变的攻击方式，要重新思考和完善我们的下一代安全体系。随着“大数据”时代的来临，在安全领域中信息系统的规划、建设、投资等决策将日益基于数据和分析而做出判断，而并非过去基于经验和直觉的模式。如何直观展现信息系统的实时安全态势、为安全决策提供数据依据，如何采集、分析数据，提供定期的报表统计，包括攻击类型分布、高风险攻击事件统计、安全漏洞发布等成为了政企用户的面临的首要问题。我们建议政企用户从以下四个方面着手解决信息系统安全问题：通过强大的综合分析能力，为信息部门提供数据参考和决策支持应随时了解信息系统的运行情况和安全状况、安全态势，在海量数据的基础上，对安全事件和安全态势进行综合分析，得出宏观的规律和各类不同事件相互联系的规律，为信息部门提供强有力的数据参考和决策支持。提高安全事件的响应和处理能力结合监控中发现的问题，以及在安全检查中对自身脆弱性的了解，为应急响应的处理提供了依据，同时依据自身及行业特点，建立安全知识库。鉴于目前多数政企单位并不具备独立处理安全事件的技术实力，政府单位需要专业安全服务厂商提供安全事件的预警、响应和必要的技术支持，提高政企单位信息部门的安全事件响应与处理能力。预先防范，提前做好安全性检查，全面提升主动检测能力 Web应用的安全性成为越来越需要关注的问题，有近40%的入侵是由于Web应用的问题造成的。在AppliedResearch发表的一份调查报告中，企业反馈超过一半的最频繁的攻击是针对Web应用的。这些攻击中有一半都出现在着名“OWASP十大威胁”名单中。面对这些持续而频繁的攻击，政企用户需要进行定期的安全检查，及时主动发现信息系统中存在的安全漏洞及潜在威胁。建立信息系统安全事件监测机制，及时发现信息系统安全问题运维阶段中，我们如何及时发现异常行为?这是正常用户应该出现的行为吗?该用户是否被控制或穿了马甲?比如某台服务器出现了大量的外连上传行为、进出访问IP中出现大量陌生的境外IP或CNCERT通报的恶意IP等。所以，政企用户需要建立一套有效的安全事件监控和预警措施，能够在信息系统即将遭到攻击或已经遭到攻击时，快速、准确地发现攻击行为，并迅速启动处置和应急机制。同时可以对信息系统的安全事件进行综合分析，了解当前整体系统的安全态势，为整体网络与信息安全规划提供有效的数据支持。

互联网时代的网络自动化运维

互联网上有两大主要元素"内容和眼球"大数据时代智能运维，"内容"是互联网公司(或称ICP)提供的网络服务大数据时代智能运维，如网页、游戏、即时通信等，"眼球"则是借指海量的互联网用户。互联网公司的内容往往分布在多个或大或小的IDC中，越来越多的"眼球"在盯着ICP所提供的内容，互联网公司进行内容存储的基础设施也呈现出了爆发式的增长。为了保障对内容的访问体验，互联网公司需要在不同的运营商、不同的省份/城市批量部署业务服务器用以对外提供服务，并为业务模块间的通信建立IDC内部网络、城域网和广域网，同时通过自建CDN或CDN专业服务公司对服务盲点进行覆盖。因此随着业务的增长，运维部门也显得愈发重要。他们经过这些年的积累，逐步形成了高效的运维体系。本文将结合国内互联网公司的经验，重点针对IT基础设施的新一代自动化运维体系展开讨论。

一、运维的三个阶段

● 第一个阶段：人人皆运维

在早期，一个公司的IT基础设施尚未达到一定的规模(通常在几台到几十台机器的规模)，不一定有专门的运维人员或部门，运维的工作分担在各类岗位中。研发人员拥有服务器权限，自己维护和管理线上代码及业务。

● 第二个阶段：纵向自动化

随着业务量的增长，IT基础设施发展到了另外一个量级(通常在上百台至几千台机器的规模)，开始有专门的运维人员，从事日常的安装维护工作，扮演"救火队员"，收告警，有运维规范，但运维主要还是为研发提供后置服务。

这个阶段已经开始逐步向流程化处理进行过渡，运维部门开始输出常见问题处理的清单，有了自己业务范围适用的自动化脚本，开始利用开源软件的拼装完成大部分的工作。

具体表现为：各产品线有自己编写的脚本，利用如SVN+puppet或chef来完成服务器的上线和配置管理等工作。

● 第三阶段：一切皆自动

在互联网化的大潮中，越来越多的黑马团队应运而生，都曾有过短时间内用户访问量翻N倍的经历。在流量爆发的过程中，ICP的互联网基础服务设施是否能够很好的跟进，直接决定了业务内容能否满足海量用户的并发访问。

与此同时，运维系统需要足够地完善、高效、流程化。谷歌、腾讯、百度和阿里等规模的公司内一般都有统一的运维团队，有一套或多套自动化运维系统可供参照，运维部门与开发部门会是相互平行的视角。并且也开始更加关注IT基础设施在架构层面的优化以及超大规模集群下的自动化管理和切换(如图1所示)。

图1.大型互联网公司IT基础设施情况概览

二、BAT(百度、阿里、腾讯)运维系统的分析

国内的互联网公司百度、阿里、腾讯(以下简称：BAT)所提供的主要业务内容不同，IT架构不同，运维系统在发展过程中有不同的关注点。

1.腾讯运维：基于ITIL的运维服务管理

预计到2015年腾讯在全国将拥有60万台服务器。随着2012年自动化部署实践的成功，目前正在进行自动化验收的工作。在网络设备方面，后续将实现从需求端开始的全自动化工作：设备清单自动生成-采购清单自动下发-端口连接关系、拓扑关系自动生成-配置自动下发-自动验收。整个运维流程也已由初期的传统IT管理演进到基于ITIL的服务管理流程(如图2所示)。

图2.腾讯基于ITIL的运维服务管理

2.阿里运维系统：基于CMDB的基础设施管理+逻辑分层建模

CMDB(Configuration Management Database) 配置管理数据库(以下简称：CMDB)，将IT基础架构的所有组件存储为配置项，维护每个配置项的详细数据，维护各配置项之间的关系数据以及事件、变更历史等管理数据。通过将这些数据整合到中央存储库，CMDB可以为企业了解和管理数据类型之间的因果关系提供保障。同时，CMDB与所有服务支持和服务交付流程都紧密相联，支持这些流程的运转、发挥配置信息的价值，同时依赖于相关流程保证数据的准确性。可实现IT服务支持、IT运维以及IT资产管理内部及三者之间的流程整合与自动化。在实际的项目中，CMDB常常被认为是构建其它ITIL流程的基础而优先考虑，ITIL项目的成败与是否成功建立CMDB有非常大的关系。

3.百度自动化运维：部署+监控+业务系统+关联关系

百度主要面临的运维挑战包括：突发的流量变化、复杂环境的关联影响、快速迭代的开发模式以及运维效率、运维质量、成本之间的平衡等等。百度的运维团队认为，当服务器规模达到上万台时，运维视角需要转为以服务为粒度。万台并不等于"百台*100";机器的运行状态，也不再代表业务的工作状态;运维部门为研发提供前置服务，服务与服务之间关系也随着集群的扩大逐渐复杂起来。

图3.百度自动化运维技术框架

百度的自动化运维技术框架，划分为部署、监控、业务系统、关联关系四大部分，整个框架更多突出了业务与IT基础设施的融合，注重"关联关系"的联动。所谓关联关系，主要是指任务与任务之间的时序依赖关系、任务与任务之间的数据依赖关系、任务与资源之间的引用依赖关系，分别对应到任务调度、数据传输、资源定位的服务流程中，形成了多条服务链。

关联关系的运维与业务较强相关，需要有一套系统能够理清楚关系的全貌，从而在复杂的服务链上，定位运行所在的环节，并在发生故障时预估影响范围，及时定位并通知相应的部门。在这样的一套系统中，自动化监控系统非常重要。百度的技术监控框架，主要通过数据采集、服务探测、第三方进行信息收集，进行监控评估后交给数据处理和报警联动模块处理，通过API接口进行功能扩充(如图4所示)。

图4.百度自动化技术监控框架

其实无论是BAT等互联网企业还是其他行业的企业，在IT建设中都会遵循IT基础架构库(ITIL)或ISO20000服务管理的最佳实践，采用自动化IT管理解决方案以实现重要的业务目标，如减少服务中断、降低运营成本、提高IT效率等等。随着ISO20000、ITIL v3.0的发布和推广，两者已经成为事实上的某种标准。在当今企业IT管理领域，对两个标准有着很迫切的需求。特别是ISO20000的认证要求，已经成为企业越来越普遍的需求。ITIL v3.0包含了对IT运维从战略、设计到转换、运营、改进的服务全生命周期的管理，相关方案往往覆盖了多个领域和多个产品，规划实施和工具的选择会比较纠结。如果选择开源的工具，从CMDB开始就会遇到很多的开发工作，对于很多注重成本收益比的企业，可以参考，但由于无法保证性能与效果并不一定适用。因此，成熟的商业方案会是更好的选择。

最新的iMC V7版本，围绕资源、用户、业务三个维度进行创新，发布了SOM服务运维管理(基于ISO20000、ITIL标准)等组件，增加了对服务器的管理，能很好的满足更多互联网化的场景需求。

通常认为，一个高效、好用的配置管理数据库一般需要满足6条重要标准，即联合、灵活的信息模型定义、标准合规、支持内置策略、自动发现和严格的访问控制。企业IT基础架构的元素类型、管理数据的类型往往有较多种，如网络设备、服务器、虚拟机等，因此对于多种信息的存储需要有合适的联合的方法。虽然 iMC智能管理平台在网络设备、服务器设备等方面已经能够较好的的满足，但是随着服务器虚拟化技术的发展，虚拟机正越来越多的成为IT基础架构的一大元素。因此，针对这一需求华三通信基于CAS CVM虚拟化管理系统，对服务器CPU、内存、磁盘I/O、网络I/O等更细节的重要资源以及虚拟机资源进行全面的管理。与BAT不同，华三通信的网管软件面向全行业，目前虽然没有对域名管理等特殊资源的'管理，但是能够通过API接口等方式与特有系统进行联动，进而满足定制化运维的需求，尤其是在互联网化的场景中，针对不同的业务需求，可以实现很多定制化的对接需求，例如，iMC+WSM组件与国内某大互联网公司自有Portal系统进行了对接，打通了iMC工具与用户自有运维平台，很好的实现了架构融和。另外，与阿里的逻辑分层建模相似，H3C "iMC+CAS"软件体系在上层也做了很多的逻辑抽象、分层，形成了诸多的模块，也即是大家看到的各种组件。

三、网络自动化运维体系

"哪怕是一个只有基础技术能力的陌生人，也能做专业的IT运维;哪怕是一个只有初中学历的运维人员，也能够带队完成中小型机房节点的建设，并负责数百至上千台服务器的维护管理工作"--这是一些公司对自己IT运行维护水平的一个整体评价。看似有些夸大的嫌疑，但实际上依托于强大的IT运维系统，国内已经有不少互联网公司能够达到或者接近这一标准。

这些企业都经历了运维发展过程中的各个阶段，运维部门曾经也是被动的、孤立的、分散的"救火队"式的团队，在后来的发展过程中，IT系统架构逐渐走向标准化、模型化，运维部门建立了完整的设备、系统资源管理数据库和知识库，包括所有硬件的配置情况、所有软件的参数配置，购买日期、维修记录，运维风险看板等等，通过网管软件，进行系统远程自动化监控。运维过程中系统会收集所有的问题、事件、变更、服务级别等信息并录入管理系统，不断完善进而形成一套趋向自动化的运作支撑机制。按照云计算的体系架构，在这样一套系统中，主要的IT资源包括计算、存储、网络资源，近些年随着网络设备厂商的推动，网络设备管理方面的自动化技术也得到十足的发展。

总结来看，一个企业在进行互联网化的建设初期，就需要考虑到随着用户访问量的增加，资源如何进行扩展。具体可以细化为规划、建设、管理、监控、运维五个方面。

1.规划模型化

为了确保后续业务能够平滑扩容，网管系统能够顺利跟进，互联网企业一般在早期整体系统架构设计时便充分考虑到标准化、模型化，新增业务资源就好比点快餐，随需随取。

标准化：一是采用标准协议和技术搭建，扩展性好，使用的产品较统一，便于管理;二是采用数据中心级设备，保证可靠性、灵活性，充分考虑业务系统对低时延的要求。

模型化：基于业务需求设计网络架构模型，验证后形成基线，可批量复制，统一管理，也适宜通过自动化提高部署效率、网管效率。

图5.常见互联网IDC架构

2.建设自动化

互联网IT基础设施具备批量复制能力之后，可以通过自动化技术，提高上线效率。在新节点建设过程中，3～5人的小型团队即可完成机房上线工作。例如某互联网公司某次针对海外紧急业务需求，一共派遣了2名工程师到现场进行设备安装部署和基本配置，而后通过互联网链路，设备从总部管理系统中自动获取配置和设备版本，下载业务系统，完成设备安装到机房上线不超过1周时间。

要达到自动化运维的目标，建设过程中需要重点考虑批量复制和自动化上线两个方面(如图6所示)。

批量复制：根据业务需要，梳理技术关注点，设计网络模型，进行充分测试和试点，输出软、硬件配置模板，进而可进行批量部署。

自动化上线：充分利用TR069、Autoconfig等技术，采用零配置功能批量自动化上线设备，效率能够得到成倍提升。

图6.批量配置与自动化上线

○ Autoconfig与TR069的主要有三个区别：

○ Autoconfig适用于零配置部署，后续一般需要专门的网管系统;TR069是一套完整的管理方案，不仅在初始零配置时有用，后续还可以一直对设备进行监控和配置管理、软件升级等。

○ Autoconfig使用DHCP与TFTP--简单，TR069零配置使用DHCP与HTTP--复杂，需要专门的ACS服务器。

安全性：TR069更安全，可以基于HTTPS/SSL。

而H3C iMC BIMS实现了TR-069协议中的ACS(自动配置服务器)功能，通过TR-069协议对CPE设备进行远程管理，BIMS具有零配置的能力和优势，有灵活的组网能力，可管理DHCP设备和NAT后的私网设备。BIMS的工作流程如图7所示。

图7.H3C iMC BIMS工作流程

3.管理智能化

对于网管团队而言，需要向其他团队提供便利的工具以进行信息查询、告警管理等操作。早期的网管工具，往往离不开命令行操作，且对于批量处理的操作支持性并不好，如网络设备的MIB库相比新的智能化技术Netconf，好比C和C++，显得笨拙许多。因此使用的角度考虑，图形化、智能化的管理工具，往往是比较受欢迎。

智能化：使用新技术，提升传统MIB式管理方式的处理效率，引入嵌入式自动化架构，实现智能终端APP化管理(如图8所示)。

图8.消息、事件处理智能化

● Netconf技术

目前网络管理协议主要是SNMP和Netconf。SNMP采用UDP，实现简单，技术成熟，但是在安全可靠性、管理操作效率、交互操作和复杂操作实现上还不能满足管理需求。Netconf采用XML作为配置数据和协议消息内容的数据编码方式，采用基于TCP的SSHv2进行传送，以RPC方式实现操作和控制。XML可以表达复杂、具有内在逻辑、模型化的管理对象，如端口、协议、业务以及之间的关系等，提高了操作效率和对象标准化;采用SSHv2传送方式，可靠性、安全性、交互性较好。二者主要对比差异如表1所示。

表1 网管技术的对比

● EAA嵌入式自动化架构

EAA自动化架构的执行包括如下三个步骤。

○ 定义感兴趣的事件源，事件源是系统中的软件或者硬件模块，如：特定的命令、日志、TRAP告警等。

○ 定义EAA监控策略，比如保存设备配置、主备切换、重启进程等。

○ 当监控到定义的事件源发生后，触发执行EAA监控策略。

4.监控平台化

利用基本监控工具如Show、Display、SNMP、Syslog等，制作平台化监控集成环境，实现全方位监控(如图所示)。

; 关于大数据时代智能运维和大数据自动化运维的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。大数据时代智能运维的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于大数据自动化运维、大数据时代智能运维的信息别忘了在本站进行查找喔。

标签：智能运维运维数据大数据智能

暂时没有评论，来抢沙发吧~

大数据时代智能运维（大数据自动化运维）

智能运维服务都有哪些功能以及效果呢？

大数据时代数据中心运维管理

大数据时代，为风电运维带来哪些机遇

大数据时代下的安全运维服务如何实现？

互联网时代的网络自动化运维

睿象云智能告警平台的分派策略

智能告警平台CA如何分组及邀请成员

智能告警平台CA的用户角色和权限