AIOps 一场颠覆传统运维的盛筵
953
2022-10-02
MIS 060:进阶了解IT运维规划与管理
随着企业信息化建设水平的提高,IT系统越来越庞大,并且越来越复杂,企业的日常运营与管理,几乎离不开IT系统的支持,IT系统的任何波动和故障,都会直接影响公司业务的正常开展和进行。前面已经介绍了信息系统运行和维护方面的知识,现在需要进一步理解IT运维管理,因为企业需要具备合理有效的IT运维策略才能保证业务系统的正常运作。
01
全面理解IT运维管理
IT运维管理是指企业IT部门采用相关的方法与技术,对企业信息化基础设施和信息系统的检查、维护、维修工作进行合理的组织和有效的管理。IT运维管理主要包括八个方面的内容:
①设备管理,对网络设备、服务器设备、操作系统运行状况进行监控和管理。
②应用/服务管理,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理。
③数据/存储/容灾的管理,对系统和业务数据进行统一的存储、备份和恢复。
④业务管理,包含对企业自身核心业务系统运行情况的监控和管理,对于业务的管理,主要关注该业务系统的关键成功因素和关键绩效指标。
⑤目录/内容管理,主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理。
⑥资源资产管理,管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并可以与企业的财务部门进行数据交换。
⑦信息安全管理,主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等。
⑧日常工作管理,该部分主要用于规范和明确运维人员的岗位职责和工作安排,提供绩效考核量化依据,提供解决经验与知识的积累与共享手段。
02
IT运维的规划
企业IT运维,或者称为信息系统运维管理,需要良好的规划。IT运维管理规划的要求包括:
Ø 应对运维管理体系的建设提出要求,明确管理职责和管理制度;
Ø 应对运维工作的范围提出要求,明确针对信息化基础设施及系统的运维目标和主要内容;
Ø 应对运维管理工作方式提出要求,明确运维工作的主要流程;
Ø 应对运维目标和计划的完成情况提出质量评估的要求,明确评估方法和指标;
Ø 应对运维文档的规范性提出要求,明确主要文档的内容和文档管理制度。
03
IT运维管理流程
一般地,IT运维包含如下工作流程:
①服务级别管理。服务级别管理确保用户需要的IT服务得到持续的维护和改进。其核心流程包括:识别和定义客户需求、编制服务级别协议及运营级别协议、支持合同和服务质量计划、有效监控服务质量、定期评审管理报告、根据评审结果提出改进意见。
②事件管理。事件管理的目的在于迅速有效地解决运营中发生的故障。其核心流程包括:识别和定义IT服务事件;定义事件的影响度、紧急度和优先级;各部门利用统一的事件管理系统记录、评价、排查、解决、归档各类运维服务事件类型;建立从调度部门到运维技术部门再到厂商的升级流程。
③问题管理。问题管理旨在规避或控制重大故障发生及其影响,其核心流程包括:建立健康检查规范,主动识别、管理潜在运维问题;制定应急响应计划,以应对突发高严重级别问题。
④变更管理。变更管理旨在管理变更过程,减少相应的错误以及变更事件的数量,其核心流程包括:定义变更授权,根据配置管理和发布管理确认变更范围;对变更范围内的请求,严格遵循请求、评价、审批、归类、记录的变更管理规则。
⑤配置管理。配置管理旨在准确掌握所有IT资产的配置和运行情况。其核心流程包括:正确记录IT基础设施中实施的变更以及配置项之间关联;实施版本控制;监控IT组件的运行状态,确保配置管理数据库准确反映配置项的实际版本情况。
⑥发布管理。发布管理确保系统变更得到有效发布,其核心流程包括:定义发布类型和发布规模,识别IT系统中的发布单元;选择适当的发布策略完成发布实施;确保配置管理数据库、门户、软硬件库和相关文档得到及时更新。
在实际的IT运维中还需要对运维质量进行评估,对运维目标和计划的完成情况提出质量评估的要求,并且明确评估方法和指标。运维管理指标体系需要综合考虑短中长期目标及战略,建立衡量运维流程绩效水平的客户指标、操作指标、人力资源指标以及财务指标。在运维管理控制流程中需要定期举行运维管理评审会议,审议IT运维中重要的服务质量问题,比照行业标杆修正管理目标,编制相应管理报告。
04
IT运维管理体系建设
为应对不断变化的IT网络,Gartner发布的2013年对众多公司和组织机构具有战略意义的十大技术与趋势,其中对IT运维管理发展总结了六大趋势:支撑大数据集中管理,虚拟化监控管理,存储系统融入一体化监控,主机监控更加细化,企业服务管理产品认可度攀升以及运维产品紧跟企业发展步伐。对IT运维管理发展趋势,企业需建立有效的IT运维管理体系,确保IT运维适应企业需要。IT运维管理体系由IT运维服务制度、服务流程、服务组织、服务队伍、技术服务平台以及运行维护对象六部分组成,涉及制度、人、技术、对象四类因素,IT运维管理体系应从这四个方面着手。
(1)建立完善的IT运维管理制度
完善的IT运维服务制度和流程是IT运维的基础。企业需要根据管理内容和要求制定相对完善、切实可行的运行维护管理制度和规范,覆盖各类运维对象,包括从投产管理、日常运维管理到下线管理以及应急处理的各个方面。
(2)组建专业化的IT运维团队
IT运维服务的顺利实施离不开高素质的运维服务人员,对于大中型企业而言,必须组建专业化的IT运维服务团队,不断提高运维服务队伍的专业化水平,才能有效利用技术手段和工具,做好各项运维工作。
(3)遵循标准化的IT运维流程
为保障运行维护体系的高效、协调运行,应依据管理环节、管理内容、管理要求制定统一的运行维护工作流程,实现运行维护工作的标准化、规范化,使运维人员在制度和流程的规范和约束下协同操作。根据ITIL实践规范,IT运维流程通常包括服务级别管理、事件管理、问题管理、变更管理、配置管理和发布管理六大环节。
(4)建立成熟的运维技术平台
IT运维技术服务平台包含实施运行维护和技术服务的各种手段和工具,通过技术手段固化标准化的流程、积累和管理运维知识并开展主动性运维工作。通过建立统一、集成、开放并可扩展的运维管理平台,可以实现对各类运维事件的全面采集、及时处理与分析,实现运行维护工作的智能化和高效率。
【拓展阅读】中海油数据可视化服务IT运维在日常运维、重点保障、以及应急期间如何快速的进行故障分析和问题定位,怎么使网络数据可视化,让IT运维人员和值班人员一次浏览大量的数据,并迅速发现异常数据或探测将来的趋势和问题,可视化的分析展示工具将起到越来越重要的作用。为进一步加强管控力度及时响应IT运维中出现的故障,中国海油集团公司优化和丰富了监控大屏的内容,专门成立项目组,设计和实现数据可视化系统,来实现IT信息在日常运维、重点保障、应急、展示四种模式的数据大屏可视化、桌面可视化以及APP移动端的展示。数据可视化系统由数据采集、数据清洗、数据建模、数据展示等四部分组成。数据采集需建立标准化的数据采集接口,由监控系统、动环系统、各业务系统进行推送。数据清洗是将采集到的数据进行预处理,转化为所需要的较为规整的数据,以方便统计分析和数据建模。数据建模在这里主要是针对机房的机柜、机架、空调、动力系统等,通过3D建模工具进行绘制和数据关联,以便于运维人员在大屏上对机房环境集中监控。数据展示通过可视化工具,使用其丰富的组件库,实现Web页面在大屏的图表、地图等数据交互和下钻等效果。——资料来源:刘丽媛.数据可视化在IT运维中的应用[J].信息系统工程,2020(06):71-72.
商业合作或投稿:xvmaster130@163.com
发表评论
暂时没有评论,来抢沙发吧~