AIOps 一场颠覆传统运维的盛筵
1399
2023-02-05
本文目录一览:
立足数据中心运维管理的现状,顺应时代发展的潮流,充分利用信息技术的机遇,利用现有资源对数据中心的运维管理加强完善和创新,为行业的发展,国家的进步贡献力量。
1.大数据时代数据中心运维管理的现状
大数据时代作为时代发展的机遇出现在大众视野,但是也是作为挑战逐步渗透在行业的数据中心运维管理中。以计算机技术为依托的数据中心运维管理的显著特点就是大规模的数据流量,正在不断与原有的数据中心架构产生冲突。
目前,大数据时代的数据中心运维管理的先进意识已经深入人心,但是实际项目操作过程中会有众多的问题出现。因为在磨合期,所以现有设备不能满足大数据时代的数据中心管理要求;运维管理人员的没有经过大数据时代新的运维管理思路的熏陶,技术水平与之不匹配;还有就是数据中心的运维管理制度不都完善,相应的管理水平不高。
2.解决数据中心运维管理困境的策略
针对目前数据中心运维管理的困境,本文提出了相应的解决策略,以供业界参考。
2.1 提升运维管理人员的整体能力
基于目前数据中心运维管理工作人员的实际能力,通过采取以下积极的措施来提升运维管理工作人员的综合能力水平。
2.1.1 大数据背景下,强化数据中心运维管理人员的技术应用水平
通过多维度的检验途径,比如定期检查该技术的理论与实践水平确定工作人员的当前能力,在制定符合目前技术短板的相关培训,从而保证运维管理工作的顺利进行。
2.1.2 加强管理方面的知识渗透
在加强数据中心运维管理人员的技术应用水平的前提下,可以加强管理学知识的渗透,为技术团队的整体语言表达能力的提升以及为管理层储备后续力量,既懂技术又懂管理的新世纪人才,有助于数据中心运维管理工作更加高质量的完成。
2.1.3 加强工作人员执行力,更高效的完成工作
在数据中心运维管理的众多评价标准中,执行力是影响一个团队整体运作能力很重要的一个指标,良好的执行力可以保证时间段内的工作目标提前完成或者超量完成。
2.2 强化业务管理工作和业务培训工作
现如今,科学技术的更新速度往往超出人们的接受速度,在数据中心运维管理这个领域也同样适用。所以使得运维管理人员刚刚熟练掌握新的运维既能并熟练应用,新的技术又刷新了行业应用领域。所以设立专门的培训机构,强化管理人员终身学习的意识,紧跟时代发展的脚步。
2.2.1 制定合理的业务培训和业务管理培训计划
科学合理的方案总能给与人们正确的指导,并保证在规定期限内达到既定目标。运维管理培训和业务培训的内容要与时俱进,不断为管理人员灌输新的知识,为运维管理的工作融入新鲜的血液。
2.2.2 合理安排培训时间
运维工作人员在企业内是员工,男性员工在家庭里是儿子,是丈夫,是爸爸,所以要协调好培训的时间,保证员工能充分解决员工之外的各种事情,全身心的投入工作。
2.2.3 使业务管理和业务培训的形式呈现多元化
公司管理层应加强与行业内部个组织间的联系,比如同专业的大学、同行业资深专家、专业讲座等等。通过多元形式的学习加深对行业发展的了解,并积极促进管理人员的专业素养。
2.2.4 定期进行培训效果的考核
在定期进行学习之余,为检验学习效果是否达到预期目标,应适时进行检验,进一步促进运维工作人员的学习质量的提升,提升其主观学习的动力。
总之,强化对运维工作人员的业务培训,能够有效地对运维工作者的维修技术进行与时俱进的培训,能够有利于运维管理工作人员进行数据中心运维管理工作的开展,最终有利于信息技术飞速发展下的运维工作的稳定进行。
2.3 加强了解整体行业环境的意识
有些企业的运维管理的硬件设施和软件配备欠缺,造成整体的管理水平低,是因为企业没有采取相应的举措保障。以下将详细讲述如何提升整体行业环境的了解。
(2)定期组织团队中的成员进行行业发展前景的探讨,在探讨交流的过程中了解当下运维管理工作的总趋势,从而能够为运维工作的有效进行提供有价值的参考意见。
总之,强化了解和分析业务环境的意识,能够有利于运维管理工作人员有行业的危机意识和行业的发展意识以及个人职业规划意识的提升,最终有利于大数据时代数据中心运维管理工作的顺利开展。
3.大数据时代下,技术层面面临的挑战
3.1动力环境监控系统概述
通过应用数据采集系统,计算机和网络技术,逐步完成数据中心运维管理动力电源供电设备的运行和机房的监控的平台就是数据中心动力环境监控系统。
3.2 动力环境监控数据的特点。
通过采集数据中心的关键指标数据,针对实际运行情况实现预警功能、远程功能以及运行监测功能。动力环境监控数据具有其本身特点。
3.2.1 数据结构化、格式化程度高
因系统采集到的实时监控数据大都存储于数据库中,因而动环监控数据结构化、格式化程度高,这也为数据挖掘提供了便利。
3.2.2 实时更新
动力环境监控系统运行的最底保证便是数据的准确性和实时更新,其数据采集的更新时间间隔为每秒。
3.2.3 时序性
动力环境监控系统实时记录的环境温度、环境湿度等数据都是随时间更替而进行采集的。
3.3 数据挖掘提高告警信息准确性
动力监控系统是以计算机为载体,以信息技术为依托的技术,所以其产生的大规模数据也是大数据时代一个突出的特点。就目前而言大规模的数量利用率较低,即使专业水准较高的管理人员也会深感难度高、工作量大,与现有的技术水平不能完好对接。
数据挖掘技术的出现解决了目前的难题。数据挖掘中关联分析方法解决了数据中心运维管理中不明原因的重复警报,为运维管理的工作有序进行提供了基础,并为专业水平较低的运维人员提升了工作效率。
3.3 运维经验知识化的工作模式需要改进
据以往的运维工作人员的叙述,过度依赖专家给与的指导经验,成为行业内部的不良风气。首先运维专家的培养周期较长,短时间没有任何效益输出;其次专家的意见偶尔会带有强烈的主管色彩,但是对于实际操作过程并不适用,最终导致工作的延误;最后就是过度依赖专家,若运维专家不在职装天下将会对运维管理工作造成重创,不具有可持续性。
所以建立关于数据中心运维管理的内部数据和外部数据,为现有的运维人员过度依赖专家的不良习惯提出解决方案。内部数据主要是指内部运维经验;外部数据是指来源于互联网的运维知识。对于收集到的内外部数据,利用文本挖掘、聚类、分类预测等方法对信息进行加工展现,转化成知识库中的知识,并实现对信息的快速、自动化检索。
3.4 资源调度成为容量管理的关键
在大数据时代下,数据中心存储容量指标是指机位空间指标等,尤其是计算资源指标,是其组成的关键部分。需要最新的数据中心运维管理平台实现监测服务器、使用网络以及存储资源等功能,根据实际情况进行管理策略的变动和资源的优化配置。
云计算技术已成为数据中心运维管理的核心,并打破传统的数据运维管理信息系统结构,建立一个全新的集计算、存储、和网络三维一体的虚拟资源库,通过实际的操作,实现现有资源的动态优化配置。
虚拟化技术可以保证存储环节中大规模数据的安全性,在逐步实现数据资源的重复使用、关联以及动态管理等动能的同时,也为运维管理人员提出了巨大的挑战。故此,通过科学合理的分析容量数据,构建完善的资源调度制度,实现实现新一代数据中心资源在应用间的动态分配,将成为大数据时代下数据中心运维管理的一大挑战。
4.结束语
为顺应大数据时代的潮流,必须进行数据中心运维管理的深度优化,为数据中心的整体发展提供新鲜的 科技 动力。通过提升运维管理人员各方面的能力还有利用先进的动力环境监控系统技术,为数据中心的运维管理提供强大的人力支持和技术支持,助力大数据时代背景下,数据中心运维管理的长足发展。
参考文献
[1]朱玉立,任义延,高甲子等,浅谈大数据时代下的数据中心运维管理[J].信息系.统工程,2015.
[2]解林超,石佳,王仲锋等。大数据时代对传统数据中心的影响及思考[J].中国新通信,2014.
[3]周焘。大数据时代的档案大编研[J].陕西档案,2014.
[4]陈艺高,动环大数据,提升运维效能[J].通信电源技术,2014.
[5]张隽轩,张文利,黄毅。数据中心运维系统应用ITIL管理体系分析[J].智能建筑与城市信息,2015.
[6]宋维佳,马皓,肖臻,张晓军,张蓓.虚拟化数据中心资源调度研究[J].广西大学学报:自然科学版,2011,36(01):330-334.
轻量化数据中心 3D 机房数字孪生解决方案,涵盖拓扑图~
以数据中心实际场景为基础,在场景中通过城市、园区、机房等建筑及设备外观,体现数据中心的空间位、周边环境等信息。通过对数据中心环境、资产、容量、动力等数据源的采集、处理、分析,为运维人员提供集中监控、集中管理、科学决策等全生命周期运维能力。
为 Web 可视化提供丰富的展示形式和效果,帮助用户快速搭建出数字孪生机房 3D 场景,达到所见即所得的效果。
实现对数据中心的众多子系统集中监控、集中管理的目的,降低机房管理难度,减轻机房运维压力。也可为不同业务增长需求提供了灵活的解决方案。
3D 机房场景内的机架、配电柜、UPS、空调、IT 设备等与实际物理场景一一对应。通过搭载智能传感设备,对资产的基本信息、空间占用、利用情况、PUE、告警记录等数据同步监测。
将精细监测能耗流向,实时分析管理,在 2D 可视化面板中直观动态显示 PUE 值,同步协助找出 PUE 升高或降低的原因,持续进行能效优化,支撑实现绿色数据中心。
将 2D 面板与数据绑定,同步显示设备的业务 IP、设备厂商、设备高度、起始 U 位、结束 U 位、维护人、CPU 温度、设备功耗等关键信息的动态数据。以简洁的表现形式,为用户呈现多角度、细致、全面、直观的关键性数据,挖掘数据背后的价值。
机房资源的容量管理始终都是个棘手的难题,往往需要兼顾空间、配电、硬件资源等多方面因素。场景中根据实际物理场景, 1:1 立体还原了机房可容纳机柜、实际使用机柜数、设备摆放等。
针对机柜 U 位、电力、承重等情况,则以机架为单位,应用 U 位柱状容量可视化效果,将 U 高、电力、承重三个维度的综合空间进行动态统计,直观展示机房内容量使用情况,帮助运维人员更有效地管理机房容量资源,让基础资源使用情况可以一目了然。
对于设备上架操作,运维人员可根据上架设备的 U 高、承重、电力等要求等多个组合条件进行适配空间搜索,帮助运维人员为新增设备快速定位到合适的上架空间,让机房各类资源负荷更加均衡。
拓扑图拓扑结构图是指由网络节点设备和通信介质构成的网络结构图,网络拓扑设计的好坏对整个网络的性能和经济性有重大影响。
2D/3D 可视化引擎具有强大交互能力,拓扑图形及表盘图表等非常适合用于实时监控系统的界面呈现。本次打造的全新 2D 组态界面中,采用固定面板方式呈现电力系统与制冷系统设备的实时运转参数和状态模式。让“一张图”切换查询功能,帮助运维人员快速捋清逻辑关系、设备状态,实现问题快速定位。
3D 拓扑图
但随着数据中心设备数据的不断增长,以往平面又密集的 2D 组态表现形式却不再适用于多数据的呈现。在此基础上,3D机房数字孪生解决方案增加 3D 可视化的形式,按照机房内实际布局对制冷系统的风冷水主机、冷水泵、蓄冷罐和电力系统的进线开关柜、计量柜、电容器组等资产,进行 3D 拓扑可视化呈现。
场景中提供资产之间的全链路拓扑可视呈现,帮助运维人员快速校对资产与资产之间的链路链接,轻松查找关联的业务。
相较传统的 2D 拓扑图,3D 拓扑图既能承载更多的业务信息,又可以更立体、多样、生动的展现设备的上下游依赖关系,构建出一张分层分权的网络拓扑关系图,让运维人员能立体化、多面性、深层次地观察各类设备之间互联关系。还可广泛应用于电信网络可视化、电力网络可视化、其他领域管网可视化。
智能巡检数据中心日常维护通常需要大量的运维人员按时巡检、手工抄录,但会导致检巡频次降低且耗时也过长。配合智能巡检机器人替代人工巡视,实现对机房安全设备、网络设备、服务器主机、UPS 硬件状态监控、IT 资产管理等设备的自主监视、故障监测、远程告警管理。从而构建大范围、无死角的运维管理环境,打造数据中心无人值守的管理模式。
通过数据中心 3D 全息视图将数据中心机房内多个分散的监控系统和运维流程归集融合,横向打通数据中心信息管理孤岛,纵向对接上层事务处理与下层实时控制系统,增强各个子系统之间的协同能力。Hightopo可视化大屏塑造全方位、多层次、立体化的资产管理、容量管理、动环管理、能耗管理监管体系。
IT运维中有一项重要内容就是对IDC机房数据中心it运维的运维。IDC机房是用来存放服务器的场所数据中心it运维,对IDC机房的维护可以保障服务器的正常运行,减少故障发生,延长设备寿命。如何对IDC机房进行维护呢?让我们一起听听IT运维专家的建议:
IDC机房运维
1.机房环境控制
定期对设备进行除尘、清理,调整安保摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备内部。同时检查机房通风、散热、净尘、供电、架空防静电地板等设施。机房室内温度应控制在5℃-35℃,相对湿度应控制在30%-85%。
2.机房空调维护
检查空调运行是否正常,换风设备运转是否正常。从视镜观察制冷剂液面,看是否缺少制冷剂。检查空调压缩机高、低压保护开关、干燥过滤器及其他附件。
IDC机房运维
3. UPS及蓄电池维护
根据实际情况进行电池核对性容量测试数据中心it运维;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验。
4. 消防设备维护
检查火警探测器、手动报警按钮、火灾警报装置外观及试验报警功能;检查火灾警报控制器的自检、消音、复位功能及主备用电源切换功能。
IDC机房运维
5. 电路维护
镇流器、灯管及时更换,开关更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路。
6. 基础维护
静电地板清洗清洁,地面除尘;缝隙调整,损坏更换;接地电阻测试;主接地点除锈、接头紧固;防雷器检查;接地线触点防氧化加固。
IDC机房运维
7. 机房管理体系
完善机房运维规范,优化机房运维管理体系,技术维护人员24小时及时响应。
IDC机房承载着服务器的各种事项,服务器上架、下架、处理故障等等。因此要建立健全的运维体系,保障IDC机房的平稳健康运营。
转自 https://www.toutiao.com/i6598010104509891079/
发表评论
暂时没有评论,来抢沙发吧~