关于IT运维平台发展的四个阶段的信息

来源网友投稿 1019 2023-01-06

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
本篇文章给大家谈谈IT运维平台发展的四个阶段,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享IT运维平台发展的四个阶段的知识,其中也会对进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

IT行业大多数技术人员的成长阶段大致分为哪几个呢?

第一阶段:学徒阶段
这个阶段有些人是在学校里完成,有些是通过自学完成,有些人是半路出家通过各种教育平台完成。这个阶段,刚接触代码不久,有些问题变如同雾里看花,但终究是开始行动了,所以这个阶段过得很快,心态上可能还是觉得前路不清晰但已经逐渐有了成就感。
第二阶段:初级程序员
这个阶段的人通过学习已经掌握了一部分的技能,比如知道如何团队协作、项目版本如何控制、如何使用项目管理工具、如何让代码顺利运行上线等等,这个阶段也许做了一些小的项目便开始觉得自己会得东西不少,其实只是算个半吊子程序员,这个时期的程序员很容易觉得其他程序员也不过如此。
第三阶段:中级程序员
这个阶段的程序员已经掌握了进阶的技能,并逐步确立了自己的专长,在职场中开始能够独立承担项目,并会有意识地去学习。这个阶段像一个分水岭,有些程序员除了工作不研究其他的技术,虽然在工作中很容易完成任务,但很容易就被更加年轻的程序员所代替;有些人则是不断的提升自己,热衷于研究各种技术实现细节,多和他人讨论,多看了很多书籍文献,这些人有着自己的规划,在工作几年后就是项目组中不可或缺的人。这个时期他们的薪资暂时没有太大的差距体现,也是在程序员平均水平。
第四阶段:高级程序员
这个阶段对各种编程已经有了自己的认识,一些程序员脱颖而出开始带领团队。这个阶段的程序员基本上在公司担任CTO、技术专家、首席架构师等非常关键的职位。随着自己知识的深度和广度的提高,反而会觉得自己需要学习的东西更多了,在这个阶段,他们对于团队在工作中遇到的问题,基本都能解决,因为很多知识都自成体系了,站在更高的角度宏观的看待问题。
第五阶段:自我创业
这个阶段的程序员已经有了自己的资本和人脉,很多人开始选择自我创业,哪怕不想自己成为老板也会选择与人合作创办公司,他们有些是为了实现自己的理想,有些是为了能够获得更高的生活,这个阶段的程序员已经不是单纯只考虑编程本身了,还会开始接触很多商业知识。
以上就是我的回答,希望对你有所帮助

IT服务项目生命周期是如何划分的?yunque365.com

 根据 IT 服务项目的特点,将 IT 服务项目生命周期划分为项目启动、项目规划、项目执行、项目监控、项目收尾五个阶段。这五个阶段既具有按顺序排列、又具有互相交叉的特点。五个阶段的关系见下图。



1项目启动

概述

     项目启动是 IT 服务项目生命周期的起始阶段,为后续阶段所需要的决策提供基准,项目经理通过有效的组织方式开展启动工作,并考虑项目风险,确保以审慎的方式进行项目所要求的时间和工作量投入。

目的

     项目启动的目的是使包括客户、第三方供应商、项目团队等在内的所有项目干系人,清楚项目要达到的目的、为何实施项目,初步确认如何实施项目以及他们在整个项目生命周期中的职责。项目经理通过管理项目启动阶段,为项目后续阶段奠定基础。


2项目规划

概述

     项目规划是 IT 服务项目生命周期中紧随项目启动阶段的后续阶段,此阶段项目经理依据项目启动的输出,通过规划项目人员、资源、技术和管理流程开展规划工作,确保项目能够顺利执行。

目的 

     项目规划的目的是使包括客户、第三方供应商、项目团队等在内的所有项目干系人,详细明确如何实施项目以及他们在整个项目生命周期中的职责。项目经理通过管理项目规划阶段,为项目后续阶段奠定基础。


3项目执行和监控

概述

     项目执行和项目监控是两个紧密相关的项目阶段,也是 IT 服务项目的具体实施阶段,项目经理通过有效的监控或变更方法开展工作,保证项目以计划设定或变更批准后的方式进行实施。

目的 

     项目执行和监控的目的是使包括客户、第三方供应商、项目团队等在内的所有项目干系人,在有效的执行跟踪、评估检查和变更控制下,按照服务级别协议和项目计划,持续改进地实施项目。项目经理通过管理项目执行和监控阶段,为项目收尾奠定基础。


4项目收尾

概述

     项目收尾是 IT 服务项目生命周期标志结束的项目阶段,项目收尾阶段是由项目即将结束或项目由于某些明显原因不再可行而触发的,并且项目收尾的很多工作是并行进行的。

目的

     项目收尾的目的是使包括客户、第三方供应商、项目团队等在内的所有项目干系人,清楚项目为何结束、如何结束以及他们在项目收尾中的职责。IT 服务项目经理通过管理项目收尾阶段,为项目结束进行标识。项目收尾通常包括项目正常收尾和项目终止两种类型。而从不同项目干系人划分,项目收尾可能包括客户项目收尾,第三方供应商项目收尾,IT 服务供应商内部项目收尾等。由于 IT服务项目的可延续性较强,因此在项目收尾阶段后可能会启动同一个 IT 服务项目的续签工作。在做IT服务项目的时候可以选择一款流程管理软件,如云雀运维这样的软件,可以对IT服务的整个流程进行监控,对运维事件进行整体把握,提高事件的运转效率。

IT行业发展的几个阶段及未来趋势

全球IT总支出经历2015-16两年负增长之后IT运维平台发展的四个阶段,预计2017年全球总支出3.47万亿美金IT运维平台发展的四个阶段,同比略增2.39%IT运维平台发展的四个阶段,重归正增长。设备、电信服务近两年持续下滑,而企业软件、IT服务、数据中心则保持增长。
国内IT支出与全球略微不同步,2015
年增速不降反升,达4.19%;据前瞻产业研究院发布IT运维平台发展的四个阶段的《IT咨询行业市场前瞻与投资规划分析报告》预计2017年支出达2.34万亿元人民币,同比增长5.41%,证明国内市场较全球而言需求较好。
云计算将硬件虚拟化,提供可用、便捷、按需IT运维平台发展的四个阶段的网络访问,进入可配臵的计算资源共享池——网络、服务器、存储、应用软件、服务等。这些资源能够被快速提供,只需要投入很少的管理工作,或与服务供应商进行很少的交互。
云计算作为一种使用、交付模式,穿插在企业软件、IT服务、数据中心各个领域之中。近年来云计算市场规模表现良好,全球公有云市场规模稳步增长,2012-2014保持18%以上,2015年全球
IT支出大幅负增长的情况下,依然保持15%的良好表现;2016年增速17.55%,2017年预计支出2468亿美金,重回18%的增长。
国内云计算市场规模成长性同样优于全球整体水平,2012-2014保持60%以上增速,2015放缓至54%,2016年全年支出2797亿元人民币,同比增长37.8%。
即使在2015年全球IT支出8%的负增长情况下,软件、IT服务、数据中心等新型
IT行业依然保持正增长。其中公有云市场规模增速较为抢眼,国、内外都有较大的布局潜力。公司在云计算方面的布局,目前主要代理华为云业务、微软公有云Azure,未来将开发自己的云平台“信云智联”,符合全球及国内的发展大趋势。

(转)IT:从运维到运营

https://mp.weixin.qq.com/s?__biz=MzA5MjIyNzQyNQ==∣=2656335028idx=1sn=fa3a89d46365f24056f6ac04a58c93c6scene=21#wechat_redirect

大多数ITOM领域的从业者,一直以来都约定俗成地把ITOM(IT Operation Management)翻译成IT运维管理,相应的也把IT Operations叫做IT运维。近两年来,开始有越来越多的人使用“IT运营管理”和“IT运营”这样的说法,对应的英文是一样的,但这里“运维”和“运营”是同样的意思吗?两者之间有什么异同?

关于这个问题,仁者见仁智者见智。有人认为其实运维就是运营,用个新名词只是哗众取宠的噱头而已;有人认为运维是面向IT设施的,运营是面向业务服务的;有人认为运维是关注IT指标,运营是关注业务指标的;甚至有人说,运维是“眼前的苟且”,运营是“诗和远方”:-)

总体来看,大多数人认为两者含义并不完全一样,很多人都认为IT运营比IT运维的层次更高,有些成熟度较高的大型IT组织已经提出并在执行“从IT运维到IT运营”的发展规划。但即使在提出这类理念和计划的组织内部,对于究竟什么是IT运维管理,什么是IT运营管理,也还没有非常清晰的分析和定义,更多的是将传统IT运维管理领域之外的一些新内容笼统的归到IT运营管理的部分里去。我在和某个正在执行此规划的IT组织中的某位高管交流时,他就提到:“From Operations to Operations?连定义都没搞清楚,怎么能成为指导方向和发展目标?”

他的问题让我这个ITOM的老兵也开始思考“IT运营”这个新“翻译”的真正含义,以及近几年来它日益流行的真实原因,在和许多同业交流之后,笔者在此分享一下我关于这个问题的一些想法和心得,作引玉之砖,希望能带来更多同业的讨论和指教。

首先,IT运维和IT运营,英文都是IT Operations,在老外来看,并无区别,是指关于IT运行的所有事情。而中文之所以有两种不同的翻译,是因为IT Operations包括的内容很多,IT运维和IT运营两种中文译法分别侧重其中某一部分的内容,假如归纳成一句话的话,可以说IT运维管理关注的是“活着”,而IT运营管理则有更高层次的需求,不仅要“活着”,还要“活得好”。

先看个实例,某大型数据中心IT服务能力的愿景是“以业务为中心,交付稳定、安全、高效的IT运营服务,构建业界领先的IT运营能力,支撑企业的持续发展和战略成功。”这个愿景中,“稳定、安全”就是解决活着的问题,属于传统IT运维管理的范畴,“以业务为中心”、“高效”、“业界领先”则属于如何“活得好”的范畴,更多的是IT运营管理的范畴。

能力建设是有循序渐进的过程的,任何一个组织,首先都要解决“活着”的问题,然后才有可能追求“活得好”,因此,过去三十年,在大多数IT组织面临IT设施规模快速扩张,IT应用数量不断增多,IT运行压力越来越大的挑战时,首先要确保IT系统“活着”,也就是能够持续“运行”,稳定“运转”,通过日常“维护”工作让系统少出故障,出了故障能快速“维修”,“维持”系统的正常“运转”。这个阶段把IT Operations翻译成IT运维,把ITOM翻译成IT运维管理,无可厚非。

IT运维管理阶段的关键词是“稳定”、“安全”、“可靠”,关注可用性指标(MTTR、MTTF、MTBF等)、可靠性指标(RTO、RPO)和安全合规。相应地,在技术、工具和流程上,都以稳定、安全、可靠作为最优先考虑的要素:

在以“活着”为主要目标,以“稳”为主要形态的IT运维和IT运维管理发展多年后,越来越多的IT组织开始走出这个解决基本生存需求的阶段,从“被动维持”走向“主动经营”,追求如何“活得好”,近十年来,APM、BSM、云计算、运维大数据等新的理念、技术和工具的出现、发展和变迁,都和IT正逐步开始从运维走向运营有密切关系,时至今日,从全局角度来看,可以说企业IT已经站在了从运维到运营的一个重要拐点上。

IT运营是建立在良好的IT运维的基础上的,没有“活着”,“活得好”就无从谈起。 但怎样才叫活得好呢? 换言之,IT运营追求的目标究竟是什么?比IT运维多了哪些东西呢?

与IT运维更多地是面向基础设施不同,IT运营更多的是面向业务、面向服务,本质上是面向人。我们说某个人活得好不好,如何判断呢?大多数人认同的马斯洛需求层次理论说,在解决了基本的生存问题和安全感之后,一个人要感觉自己活得好,是需要有社会认同和自我实现的。对于CIO来说,他所管理的IT组织假如能让三类人满意,我们就可以说这个IT组织已经从基本的IT运维阶段走到IT运营阶段,已经处在活得好的状态了。

哪三类人呢?

用户、老板和IT人。假如IT组织是一个独立公司的话,这三类人基本对应着客户、股东和员工,CIO如果是公司老板,就会知道其实这三类人是哪个都得罪不起的:客户不满意会流失,企业就没有生存之本;股东不满意会换人,说明企业没有竞争力;员工不满意会换地儿,企业就缺乏持久发展的能力。尽管行业特点和企业文化不同会带来优先级和侧重点的不同,但本质上,一个有长远发展前景的卓越公司,往往是做到了让客户、股东和员工都满意的公司。

IT运维阶段,IT组织更多地还是在解决三类人的基本需求,让用户能用,让老板批钱,让员工干活,当然也希望大家更满意,但受限于阶段性能力和各方面因素,先能保证这些基本需求就已经很不容易了,而做到这些,在相当长时间内也已经足够,主要因为几个原因:

因此,过去虽然IT部门提供的即使只是满足基本需求的服务,大多数情况下也并没有多大问题。但短短十年间,互联网和移动互联网大潮席卷世界的每个角落,每天用着微信滴滴淘宝携程的用户们的胃口已经越来越高了,过去能够忍受的一些小问题也已经变得忍无可忍了:

不知从哪天起,过去和企业IT八竿子打不着的“人家”一下子蹦出来,成了IT部门的变相竞争对手了,没抢走用户,但把用户满意度抢走了。更要命的是,随着云计算各种aaS的风起云涌,这些“人家”未来没准儿真的要来抢走用户了。假如IT部门不能与时俱进,还是停留在满足基本需求的运维上,而不主动向追求卓越的运营迈进,提供更有竞争力的优质IT服务,那就很可能会在几年后会碰到更大的挑战。

而在IT运营阶段,与IT运维阶段的关键词“稳定”、“安全”、“可靠”不同,关注的关键词变成了“体验”、“效率”、“效益”。回顾前面我们提到某大型数据中心的愿景中“以业务为中心”、“高效”两个运营关键词,其实“以业务为中心”就对应着“以用户为中心”,业务就是以用户为中心的吗,而用户关心的就是体验(稳定可靠也是体验的一部分)。“高效”则包含着高效率和高效益两个含义,一个关注敏捷性,交付速度、响应速度,一个关注成本收益,关注服务获取效率。

(假如说IT运维以“稳”为主,那么IT运营则以”敏“为主,在技术架构选择和IT管理流程和系统的建设上面,IT运营阶段都和传统IT运维阶段的关注重点有所转变,从而带来了新旧架构、新旧工具、新旧方法并存甚至交汇的复杂情况,Gartner在提的Bimodal,联想所说的双态IT,也都在反映这种状态。)

让我们围绕三类人的需求简单看看IT运营比之IT运维阶段要面临的新挑战,以及应对挑战在出现的一些新的理念、工具和技术:

让用户满意

用户大致有两类,个人用户和业务部门:

个人用户,不论是内部用户还是外部用户,更关心的是体验,体验主要是易用性、容错性和响应速度;要提升体验,对于IT运营管理领域就带来了新的要求,要在传统的设备和组件监控的基础上,增加端到端的用户体验感知能力、应用性能的深入探测和分析能力、应用及系统性能瓶颈的发现和优化能力。

越来越多IT组织开始关注用户体验,从而纷纷部署包括外部模拟仿真探测、流量数据分析、日志数据分析、嵌码采集探测等各种针对应用性能管理的手段工具 ,造就了近年来APM市场热度飙升。

这些采用不同手段的APM工具虽然有功能重叠的部分,但各有其侧重点,多种工具的部署能带来数据和功能的丰富性和多样性,对于准确测量和提升客户体验是有必要的,事实上在那些特别重视用户体验的IT组织里,已经或者正在进行全方位的工具部署,并在尝试在各种专业分析工具之间架设运营大数据工具,集成多样化数据,提供数据的统一可视化和整合分析等能力,提升故障和优化点的定位分析能力,深度改善用户体验。

业务部门,除了关心最终用户的体验,更关心交付效率,与之相应的,IT部门开始在各个环节上采用新架构、新技术和新工具,从各个环节上提升效率,加快业务服务的交付速度。

让老板满意

让用户满意是让老板满意的基础,假如业务部门天天在老板那儿告状,老板怎么都满意不了。但是即便业务部门都说你好话了,老板就会满意了吗?要是你真的这么认为,说明你太不了解老板这种动物了。

老板要的不只是结果,也一定会追求高效率和高效益,同样的成果,能否用更低的成本达成?我们现在的成本收益水平,对应业界同行,是人傻钱多还是精明高效?说要追求“业界领先”,怎么就是领先了?不能说技术更新应用更多就是领先吧?总要有个从效益角度的衡量方法吧?假如IT部门是一个独立运营的实体,作为给钱的股东,也是要问这些问题的。

效益本质上是投资回报率,成本越低,效益越好,做的事情越有用,效益越高。要追求高效益,首先面临的难题是要有一套成本收益的衡量体系,没有量化方法,既搞不清楚IT部门当前在同业中所处的水平,更无法通过指标考核的方式推动IT部门不断提高效益水平。在没有这套衡量体系的时候,往往只能采用一些非常粗线条甚至感性的衡量方式,比如看每年的IT采购金额、IT员工数量、工业标准产品的采购单价等,导致很多IT部门在采购时往往要求厂商保证提供同行业最低价,可当大家都这么要求的时候,显然很难真正起到效果。更为重要的是,由于每个企业在业务和IT服务方面存在的差异性,这些粗线条指标并不能反映IT部门的效率和效益水平。

ITIL体系中早就提出了IT服务财务管理的概念,许多IT组织在过去十年尝试了一些BSM(业务服务管理)和ITFM(IT财务管理)的项目,一个重要动因就是试图建立IT效益的衡量体系,可在内部IT部门中成功者寥寥,主要原因是全部精力投入到基础运维工作中还忙不过来,另一方面也和缺乏特别成功的最佳实践有关。

不过随着大家的不断尝试,伴随近年来IT架构的演进和公有云的兴起,一些走在前面的IT部门已经看到了建立IT效益衡量体系的可能性,并开始在某些架构层级上开始尝试性的探索:他们采用服务分层、成本归集、各自对标的方式,对DC层、IaaS层、PaaS层的资源单位成本、资源利用效率、能源单位成本、能源利用效率和人员运营效率进行分别统计和分析,并分别和IDC、IaaS云、PaaS云的外部供应商市场价位水平做对照,来衡量自己的效率和效益水平。

IT效益衡量体系的建立,也让IT自己可以从效益角度分解目标,推动IT内各个部门能够逐年不断提升效率和效益水平,让IT部门的思考方式从成本中心转变到利润中心。近年来绿色数据中心概念和PUE指标被关注,都反映了这一变化趋势。

要注意的是,即使建立了效益衡量体系,要让它真正发挥作用,离不开大量的数据统计和数据分析,以及关键效益指标的可视化和透明化,很多IT组织开始尝试建立IT运维/运营大数据平台,引入可视化和BVD概念,也都和追求IT效益可衡量有密切关系。而这些也会带来额外的投入,IT组织可以根据自身的规模和目标优先级,在有必要的情况下,选择合适和成熟的切入点,分步尝试,逐渐建立效益衡量体系。

让员工满意

互联网企业的火热和各行业互联网+的热闹,都带来了IT人才的争夺,如何吸引和保留高素质的IT员工,已经成为许多IT部门不得不面对的新问题。要让IT员工满意,前面的两个满意(用户满意和老板满意)也是个重要基础,否则IT部门自己地位都不高,员工也没有成就感,士气低迷,满意度很难高起来。

但即使做到了前面两个满意,假如让IT员工每天都疲于奔命,员工满意度同样会差,也不是长久之计。要解决员工满意度的问题,有几个方面是要考虑到的:

以上从三个满意的角度简单聊了聊从IT运维到IT运营的一些内容,有趣的是,这些满意是递进和包含的关系,让员工满意包括让老板满意,让老板满意包括让用户满意,让业务部门满意包括让个人用户满意,但每个满意之间又都有各自的个性化内容。

要做到三个满意,让IT从“活着”到“活得好”,从重点“维”稳走向经营业务价值,意味着IT管理要更加精细化、自动化、智能化,也必须建立多样化的数据采集、多维度的数据分析/挖掘和全方位的可视化的能力,IT运营管理的架构也将在传统监管控的IT运维管理架构上有所发展和变化,以适应IT运营在体验、效率和效益方面的更多要求。

需要注意的是,IT涉及到规划、设计、开发和运营多个环节,我们更多的是从运营的角度来谈的,事实上要从IT运维走向IT运营,不仅需要运营部门(不再只是运维部门啦)的努力,也需要规划、管理和开发部门的协同配合和齐头并进。

从IT运维到IT运营,其实标志着IT组织成熟度的提升,假如借用Gartner的IO成熟度模型来看的话,IT运维更多是在前几个阶段,而更多开始关注IT运营,则标志着IT组织走到了后两个阶段:Service Aligned和Business Partnership,开始把IT本身当做业务来运营,以客户为中心,关注客户体验,运营效率和成本收益。

以上是关于IT运维到IT运营的一些不成熟的思考,抛砖引玉,希望能得到大家的批评和指教。

从IT运维到IT运营,许多IT组织已经在路上,同样也有许多IT产品和IT服务的提供商已经洞悉到这一发展趋势,配合IT运营的要求,开发和提供了许多新的运营工具和运营服务,我们希望能够与各位有志于ITOM领域的同仁们一起,齐心协力,精益求精,共同提供优秀的ITOM产品和服务,为IT从运维到运营做一点事情,让IT不仅活着,而且要活得好,活得精彩。

互联网时代的网络自动化运维

互联网时代的网络自动化运维

互联网上有两大主要元素"内容和眼球","内容"是互联网公司(或称ICP)提供的网络服务,如网页、游戏、即时通信等,"眼球"则是借指海量的互联网用户。互联网公司的内容往往分布在多个或大或小的IDC中,越来越多的"眼球"在盯着ICP所提供的内容,互联网公司进行内容存储的基础设施也呈现出了爆发式的增长。为了保障对内容的访问体验,互联网公司需要在不同的运营商、不同的省份/城市批量部署业务服务器用以对外提供服务,并为业务模块间的通信建立IDC内部网络、城域网和广域网,同时通过自建CDN或CDN专业服务公司对服务盲点进行覆盖。因此随着业务的增长,运维部门也显得愈发重要。他们经过这些年的积累,逐步形成了高效的运维体系。本文将结合国内互联网公司的经验,重点针对IT基础设施的新一代自动化运维体系展开讨论。

一、运维的三个阶段

● 第一个阶段:人人皆运维

在早期,一个公司的IT基础设施尚未达到一定的规模(通常在几台到几十台机器的规模),不一定有专门的运维人员或部门,运维的工作分担在各类岗位中。研发人员拥有服务器权限,自己维护和管理线上代码及业务。

● 第二个阶段:纵向自动化

随着业务量的增长,IT基础设施发展到了另外一个量级(通常在上百台至几千台机器的规模),开始有专门的运维人员,从事日常的安装维护工作,扮演"救火队员",收告警,有运维规范,但运维主要还是为研发提供后置服务。

这个阶段已经开始逐步向流程化处理进行过渡,运维部门开始输出常见问题处理的清单,有了自己业务范围适用的自动化脚本,开始利用开源软件的拼装完成大部分的工作。

具体表现为:各产品线有自己编写的脚本,利用如SVN+puppet或chef来完成服务器的上线和配置管理等工作。

● 第三阶段:一切皆自动

在互联网化的大潮中,越来越多的黑马团队应运而生,都曾有过短时间内用户访问量翻N倍的经历。在流量爆发的过程中,ICP的互联网基础服务设施是否能够很好的跟进,直接决定了业务内容能否满足海量用户的并发访问。

与此同时,运维系统需要足够地完善、高效、流程化。谷歌、腾讯、百度和阿里等规模的公司内一般都有统一的运维团队,有一套或多套自动化运维系统可供参照,运维部门与开发部门会是相互平行的视角。并且也开始更加关注IT基础设施在架构层面的优化以及超大规模集群下的自动化管理和切换(如图1所示)。

图1.大型互联网公司IT基础设施情况概览

二、BAT(百度、阿里、腾讯)运维系统的分析

国内的互联网公司百度、阿里、腾讯(以下简称:BAT)所提供的主要业务内容不同,IT架构不同,运维系统在发展过程中有不同的关注点。

1.腾讯运维:基于ITIL的运维服务管理

预计到2015年腾讯在全国将拥有60万台服务器。随着2012年自动化部署实践的成功,目前正在进行自动化验收的工作。在网络设备方面,后续将实现从需求端开始的全自动化工作:设备清单自动生成-采购清单自动下发-端口连接关系、拓扑关系自动生成-配置自动下发-自动验收。整个运维流程也已由初期的传统IT管理演进到基于ITIL的服务管理流程(如图2所示)。

图2.腾讯基于ITIL的运维服务管理

2.阿里运维系统:基于CMDB的基础设施管理+逻辑分层建模

CMDB(Configuration Management Database) 配置管理数据库(以下简称:CMDB),将IT基础架构的所有组件存储为配置项,维护每个配置项的详细数据,维护各配置项之间的关系数据以及事件、变更历史等管理数据。通过将这些数据整合到中央存储库,CMDB可以为企业了解和管理数据类型之间的因果关系提供保障。同时,CMDB与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。可实现IT服务支持、IT运维以及IT资产管理内部及三者之间的流程整合与自动化。在实际的项目中,CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。

3.百度自动化运维:部署+监控+业务系统+关联关系

百度主要面临的运维挑战包括:突发的流量变化、复杂环境的关联影响、快速迭代的开发模式以及运维效率、运维质量、成本之间的平衡等等。百度的运维团队认为,当服务器规模达到上万台时,运维视角需要转为以服务为粒度。万台并不等于"百台*100";机器的运行状态,也不再代表业务的工作状态;运维部门为研发提供前置服务,服务与服务之间关系也随着集群的扩大逐渐复杂起来。

图3.百度自动化运维技术框架

百度的自动化运维技术框架,划分为部署、监控、业务系统、关联关系四大部分,整个框架更多突出了业务与IT基础设施的融合,注重"关联关系"的联动。所谓关联关系,主要是指任务与任务之间的时序依赖关系、任务与任务之间的数据依赖关系、任务与资源之间的引用依赖关系,分别对应到任务调度、数据传输、资源定位的服务流程中,形成了多条服务链。

关联关系的运维与业务较强相关,需要有一套系统能够理清楚关系的全貌,从而在复杂的服务链上,定位运行所在的环节,并在发生故障时预估影响范围,及时定位并通知相应的部门。在这样的一套系统中,自动化监控系统非常重要。百度的技术监控框架,主要通过数据采集、服务探测、第三方进行信息收集,进行监控评估后交给数据处理和报警联动模块处理,通过API接口进行功能扩充(如图4所示)。

图4.百度自动化技术监控框架

其实无论是BAT等互联网企业还是其他行业的企业,在IT建设中都会遵循IT基础架构库(ITIL)或ISO20000服务管理的最佳实践,采用自动化IT管理解决方案以实现重要的业务目标,如减少服务中断、降低运营成本、提高IT效率等等。随着ISO20000、ITIL v3.0的发布和推广,两者已经成为事实上的某种标准。在当今企业IT管理领域,对两个标准有着很迫切的需求。特别是ISO20000的认证要求,已经成为企业越来越普遍的需求 。ITIL v3.0包含了对IT运维从战略、设计到转换、运营、改进的服务全生命周期的管理,相关方案往往覆盖了多个领域和多个产品,规划实施和工具的选择会比较纠结。如果选择开源的工具,从CMDB开始就会遇到很多的开发工作,对于很多注重成本收益比的企业,可以参考,但由于无法保证性能与效果并不一定适用。因此,成熟的商业方案会是更好的选择。

最新的iMC V7版本,围绕资源、用户、业务三个维度进行创新,发布了SOM服务运维管理(基于ISO20000、ITIL标准)等组件,增加了对服务器的管理,能很好的满足更多互联网化的场景需求。

通常认为,一个高效、好用的配置管理数据库一般需要满足6条重要标准,即联合、灵活的信息模型定义、标准合规、支持内置策略、自动发现和严格的访问控制。企业IT基础架构的元素类型、管理数据的类型往往有较多种,如网络设备、服务器、虚拟机等,因此对于多种信息的存储需要有合适的联合的方法。虽然 iMC智能管理平台在网络设备、服务器设备等方面已经能够较好的的满足,但是随着服务器虚拟化技术的发展,虚拟机正越来越多的成为IT基础架构的一大元素。因此,针对这一需求华三通信基于CAS CVM虚拟化管理系统,对服务器CPU、内存、磁盘I/O、网络I/O等更细节的重要资源以及虚拟机资源进行全面的管理。与BAT不同,华三通信的网管软件面向全行业,目前虽然没有对域名管理等特殊资源的'管理,但是能够通过API接口等方式与特有系统进行联动,进而满足定制化运维的需求,尤其是在互联网化的场景中,针对不同的业务需求,可以实现很多定制化的对接需求,例如,iMC+WSM组件与国内某大互联网公司自有Portal系统进行了对接,打通了iMC工具与用户自有运维平台,很好的实现了架构融和。另外,与阿里的逻辑分层建模相似,H3C "iMC+CAS"软件体系在上层也做了很多的逻辑抽象、分层,形成了诸多的模块,也即是大家看到的各种组件。

三、网络自动化运维体系

"哪怕是一个只有基础技术能力的陌生人,也能做专业的IT运维;哪怕是一个只有初中学历的运维人员,也能够带队完成中小型机房节点的建设,并负责数百至上千台服务器的维护管理工作"--这是一些公司对自己IT运行维护水平的一个整体评价。看似有些夸大的嫌疑,但实际上依托于强大的IT运维系统,国内已经有不少互联网公司能够达到或者接近这一标准。

这些企业都经历了运维发展过程中的各个阶段,运维部门曾经也是被动的、孤立的、分散的"救火队"式的团队,在后来的发展过程中,IT系统架构逐渐走向标准化、模型化,运维部门建立了完整的设备、系统资源管理数据库和知识库,包括所有硬件的配置情况、所有软件的参数配置,购买日期、维修记录,运维风险看板等等,通过网管软件,进行系统远程自动化监控。运维过程中系统会收集所有的问题、事件、变更、服务级别等信息并录入管理系统,不断完善进而形成一套趋向自动化的运作支撑机制。按照云计算的体系架构,在这样一套系统中,主要的IT资源包括计算、存储、网络资源,近些年随着网络设备厂商的推动,网络设备管理方面的自动化技术也得到十足的发展。

总结来看,一个企业在进行互联网化的建设初期,就需要考虑到随着用户访问量的增加,资源如何进行扩展。具体可以细化为规划、建设、管理、监控、运维五个方面。

1.规划模型化

为了确保后续业务能够平滑扩容,网管系统能够顺利跟进,互联网企业一般在早期整体系统架构设计时便充分考虑到标准化、模型化,新增业务资源就好比点快餐,随需随取。

标准化:一是采用标准协议和技术搭建,扩展性好,使用的产品较统一,便于管理;二是采用数据中心级设备,保证可靠性、灵活性,充分考虑业务系统对低时延的要求。

模型化:基于业务需求设计网络架构模型,验证后形成基线,可批量复制,统一管理,也适宜通过自动化提高部署效率、网管效率。

图5.常见互联网IDC架构

2.建设自动化

互联网IT基础设施具备批量复制能力之后,可以通过自动化技术,提高上线效率。在新节点建设过程中,3~5人的小型团队即可完成机房上线工作。例如某互联网公司某次针对海外紧急业务需求,一共派遣了2名工程师到现场进行设备安装部署和基本配置,而后通过互联网链路,设备从总部管理系统中自动获取配置和设备版本,下载业务系统,完成设备安装到机房上线不超过1周时间。

要达到自动化运维的目标,建设过程中需要重点考虑批量复制和自动化上线两个方面(如图6所示)。

批量复制:根据业务需要,梳理技术关注点,设计网络模型,进行充分测试和试点,输出软、硬件配置模板,进而可进行批量部署。

自动化上线:充分利用TR069、Autoconfig等技术,采用零配置功能批量自动化上线设备,效率能够得到成倍提升。

图6.批量配置与自动化上线

○ Autoconfig与TR069的主要有三个区别:

○ Autoconfig适用于零配置部署,后续一般需要专门的网管系统;TR069是一套完整的管理方案,不仅在初始零配置时有用,后续还可以一直对设备进行监控和配置管理、软件升级等。

○ Autoconfig使用DHCP与TFTP--简单,TR069零配置使用DHCP与HTTP--复杂,需要专门的ACS服务器。

安全性:TR069更安全,可以基于HTTPS/SSL。

而H3C iMC BIMS实现了TR-069协议中的ACS(自动配置服务器)功能,通过TR-069协议对CPE设备进行远程管理,BIMS具有零配置的能力和优势,有灵活的组网能力,可管理DHCP设备和NAT后的私网设备。BIMS的工作流程如图7所示。

图7.H3C iMC BIMS工作流程

3.管理智能化

对于网管团队而言,需要向其他团队提供便利的工具以进行信息查询、告警管理等操作。早期的网管工具,往往离不开命令行操作,且对于批量处理的操作支持性并不好,如网络设备的MIB库相比新的智能化技术Netconf,好比C和C++,显得笨拙许多。因此使用的角度考虑,图形化、智能化的管理工具,往往是比较受欢迎。

智能化:使用新技术,提升传统MIB式管理方式的处理效率,引入嵌入式自动化架构,实现智能终端APP化管理(如图8所示)。

图8.消息、事件处理智能化

● Netconf技术

目前网络管理协议主要是SNMP和Netconf。SNMP采用UDP,实现简单,技术成熟,但是在安全可靠性、管理操作效率、交互操作和复杂操作实现上还不能满足管理需求。Netconf采用XML作为配置数据和协议消息内容的数据编码方式,采用基于TCP的SSHv2进行传送,以RPC方式实现操作和控制。XML可以表达复杂、具有内在逻辑、模型化的管理对象,如端口、协议、业务以及之间的关系等,提高了操作效率和对象标准化;采用SSHv2传送方式,可靠性、安全性、交互性较好。二者主要对比差异如表1所示。

表1 网管技术的对比

● EAA嵌入式自动化架构

EAA自动化架构的执行包括如下三个步骤。

○ 定义感兴趣的事件源,事件源是系统中的软件或者硬件模块,如:特定的命令、日志、TRAP告警等。

○ 定义EAA监控策略,比如保存设备配置、主备切换、重启进程等。

○ 当监控到定义的事件源发生后,触发执行EAA监控策略。

4.监控平台化

利用基本监控工具如Show、Display、SNMP、Syslog等,制作平台化监控集成环境,实现全方位监控(如图所示)。

; 关于IT运维平台发展的四个阶段和的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 IT运维平台发展的四个阶段的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于、IT运维平台发展的四个阶段的信息别忘了在本站进行查找喔。
上一篇:it运维安全总结(IT运维安全)
下一篇:智能运维aiops模型(智能运维aiops厂商)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~