AIOps 一场颠覆传统运维的盛筵
1400
2022-10-31
本文目录一览:
随着云计算在企业的盛行,人们多数感受到云计算使信息系统资源实现了资源的随需分配的灵活性、可伸缩性及提高了服务器的利用率等。云计算架构在企业的引入,更能有效实现企业信息系统的技术标准化和管理规范化,为企业信息系统提供更好的支持。因为随着企业信息化程度越来越高、信息系统支持的业务越来越复杂,以往各自为政、缺乏统一的管理导致的管理成本高昂、人员需求众多且资源浪费严重的弊端无疑是个瓶颈,特别对大型信息系统的运营更是桎梏。 如果将在云计算体系架构中的软硬件资源比做人的骨骼肌体的话,那么包括虚拟化、网格计算、效用计算等技术可以视作将这些资源串接起来的血脉筋络,而要使这些资源和技术真正发挥作用、对外提供优质服务,则还需要云计算架构中的“大脑”——云管理平台。
云管理平台最重要的两个特质在于管理云资源和提供云服务。即通过构建基础架构资源池(IaaS)、搭建企业级应用/开发/数据平台(PaaS),以及通过SOA架构整合服务(SaaS)来实现全服务周期的一站式服务,构建多层级、全方位的云资源管理体系。 云管理平台功能架构 在IaaS云中,云管理平台需要在虚拟化、网格计算、效用计算、分布式等技术的支撑下,对包括计算资源、存储资源、网络资源等在内的基础架构通过API接口进行管理,实现按需的、可计量的对基础架构资源进行分配,同时,实现对资源使用情况和健康情况的监控以及对事件的捕获和处理。 在PaaS云中,云管理平台应该可以通过抽象管理来将用户需求翻译成平台相关属性需求,通过平台管理和接口API编程来实现针对平台需求的资源切割和快速部署,并同样需要在此过程中实现平台资源的计量、监控,以及事件的捕获和处理。 在SaaS云层面中,云管理平台也需对实际业务需求进行抽象处理,形成应用服务管理的通用架构。要构建这样的通用架构中,还需云管理平台实现基于SOA服务的注册、注销、配置、流程设计、调度以及服务的部署等管理功能,同时在此过程中还需对服务质量和性能进行监控,并以此为依据进行服务级别(SLA)和服务计量的管理。 此外,云管理平台还需要面向用户和面向管理的统一门户来改善管理效率和提高用户体验。同时,在云管理平台的设计中,应考虑使用面向整个云管理平台的数据库,使所有的管理操作、用户使用情况、性能、事件等可回溯,同时可以此为基础进行数据分析、行为分析和决策支持,以提高整个云体系架构的服务水平和资源利用率。 主流云平台管理比较 当前业界主流的云平台管理软件包括OpenStack和CloudStack等,凭借其开源所带来的活力以及各主流芯片厂商和虚拟软件厂商的支持,迅速地在云计算领域占据领先地位,包括英国电信、塔塔集团、韩国电信等在内的大型企业都是其用户。但是,作为云管理平台解决方案,其面向的领域和提供的服务仍需进一步扩充和完善。
主要体现在如下三方面: 其一,无论是OpenStack还是CloudStack,他们关注的领域是基础设架构云,即IaaS云,对于PaaS云和SaaS云,这两种产品当前并未提供成熟的解决方案。而正如上节所述,一个完善的云管理平台应该是对包含IaaS、PaaS和SaaS在内的全方位、全流程、全生命周期的管理平台。 其二,OpenStack和CloudStack对基于x86的硬件架构及相关虚拟化软件实现IaaS云有良好的解决方案和众多成功案例,但对于以非x86芯片为基础的小型机尚无法有效在虚拟化、资源调度等方面进行管理。在此,必须说明的是在业界往往把云计算和x86画等号,认为x86化是云计算的基础和必要条件。诚然,x86架构以其标准化、开放平台以及较高的性价比在云计算实现资源的统一管理、调度方面有着天然的优势。但这并不意味着小型机平台不能进行云计算,相反,作为云计算的核心支撑技术的虚拟化技术,在以Power芯片和SPARC芯片为代表的非x86架构上更早得到实现并得到了广泛的应用。更需要强调的是,其虚拟化的实现往往是基于固件的,效率远高于各种基于操作系统的虚拟化软件。小型机以其单独物理节点的高性能、高RAS特性、高虚拟化效率等仍在关键业务领域占据重要地位,在进行IaaS云建设中,尤其是针对大型企业关键应用的私有云中,云管理平台的核心工作往往是非x86架构的小型机的云计算化。 其三、无论是OpenStack的Nova、Glance还是CloudStack Orchestration Engine,对于计算资源和存储资源的管理核心是通过虚拟化来屏蔽底层硬件的异构。这有利于创建通用的硬件架构资源池,但是,在屏蔽底层硬件异构的同时,同样屏蔽了各种硬件的独有功能和特性。 对于上述问题,究其根本原因还是因为各厂商的软硬件产品并未遵循统一的标准,而是有各自独立的体系。对于标准不统一、接口不开放的系统,想要做到资源的统一调度、各自特性的完全体现无异于缘木求鱼。但是各厂商对自身产品是完全支持和开放的,因此也形成了面向自身产品的云计算解决方案。目前,包括IBM和ORACLE公司在内,都推出了各自的云计算管理平台。它们共有的特点是其产品全线覆盖从底层硬件到上层应用。因此,其云计算解决方案也全线支持从IaaS到PaaS乃至SaaS。 IBM公司的云计算解决方案是所谓的SmartCloud Foundation,其中包括SmartCloud Entry(SCE)解决方案、IBM SmartCloud Provisioning(SCP)软件,以及IBM SmartCloud Monitoring。以用于搭建私有云的解决方案SCE为例,在SCE架构中,PowerVM技术是Power系列小型机虚拟化的基础,提供共享处理器、微分区、活动内存共享和虚拟I/O共享等虚拟化特性,同时在SCE架构中,支持包括VMWare、Xen、KVM等基于x86架构的虚拟化;System Director及其插件VMControl以底层PowerVM等虚拟化技术为基础实现系统池整合管理、自动化虚拟镜象迁移、优化虚拟化环境的性能、可靠性和能源管理等功能,除服务器外,还可以通过TPC和SVC实现存储虚拟化整合功能;在此之上,SEC提供SKC Core Framework平台,以此平台为基础部署监控、资源分配、用户管理、安全管理、模版管理、计量计费等多种功能插件,实现自服务门户(SelfService Portal),形成一套完整的、基于Power芯片和x86芯片的IaaS云解决方案。在此基础上,通过SCP和SCM,可以更进一步整合IBM的数据库产品和中间产品,形成PaaS云和SaaS云的解决方案。 ORACLE公司的云计算解决方案统一在产品Enterprise Manager(EM)中实现,尤其是在EM 12c版本中,从IaaS、PaaS到SaaS,都提供了对于云计算架构良好的支持。如前文所述,ORACLE和IBM的产品从硬件到软件乃至解决方案全线覆盖,这是其可以实现PaaS和SaaS云的重要基础。
Prometheus 最开始是由 SoundCloud 开发的开源监控告警系统,是 Google BorgMon 监控系统的开源版本。在 2016 年,Prometheus 加入 CNCF,成为继 Kubernetes 之后第二个被 CNCF 托管的项目。随着 Kubernetes 在容器编排领头羊地位的确立,Prometheus 也成为 Kubernetes 容器监控的标配。
监控系统的总体架构大多是类似的,都有数据采集、数据处理存储、告警动作触发和告警,以及对监控数据的展示。下面是 Prometheus 的架构:
Prometheus Server 负责定时从 Prometheus 采集端 Pull(拉) 监控数据。Prometheus 采集端可以是实现了 /metrics 接口的服务,可以是从第三方服务导出监控数据的 exporter,也可以是存放短生命周期服务监控数据的 Pushgateway。相比大多数采用 Push(推) 监控数据的方式,Pull 使得 Promethues Server 与被采集端的耦合度更低,Prometheus Server 更容易实现水平拓展。对于采集的监控数据,Prometheus Server 使用内置时序数据库 TSDB 进行存储。同时也会使用这些监控数据进行告警规则的计算,产生的告警将会通过 Prometheus 另一个独立的组件 Alertmanager 进行发送。Alertmanager 提供了十分灵活的告警方式,并且支持高可用部署。对于采集到的监控数据,可以通过 Prometheus 自身提供的 Web UI 进行查询,也可以使用 Grafana 进行展示。
发表评论
暂时没有评论,来抢沙发吧~