睿象云智能告警平台的分派策略
748
2023-02-09
本文目录一览:
这是因为目前,IT运维管理面临着两难境地的巨大挑战,一方面要降低成本,另一方面其复杂度又不断攀升。主要体现在数据量巨大、数据类型繁多和数据生成速度快三个维度:
IT基础架构和应用程序产生的数据量快速增长(年增长2-3倍)
机器和人工生成的数据类型越来越多(例如指标、日志、网络数据和知识管理文档)
由于采用了云架构和其他临时性的架构,数据生成速度不断提高,IT架构内变化速率也在提高
鉴于现代企业所需的洞察力,对这三个维度进行权衡的代价将相当巨大。因此,越来越多的客户对AIOps越来越感兴趣,并想通过大数据和机器学习技术来分析服务台的有效性,以此参与到故障和问题解决流程中去。IT组织还开始在DevOps环境中探索AIOps,将其作为持续集成/持续交付(CI/CD)周期的一部分,便于在部署之前预测潜在的问题,并检测潜在的安全问题。
AIOps分析的应用超越了其最初的使用范围,而成为IT运维中事件关联和分析的最佳解决方案。
如何通过AIOps手段增加运维效能和降低运维成本,对于企业来说都是很大的挑战。而致力于智能运维AIOps领域的擎创科技,已经为国内多家银行和证券用户成功部署夏洛克AIOps平台,助力企业运维降本增效:
强大自研数据采集器:支持Linux、Windows、AIX等多种系统,可采集除日志外的性能数据、网络数据、CMDB数据等各类数据;
创新的数据流处理方式:单数据流峰值每秒采集350000 条,可处理日增数据30TB;
人工智能算法:与复旦大学运维实验室共研10+种人工智能算法,异常检测和根因定位更容易。
目前,AIOps主要用于IT运维,且在企业中日益占据主导地位,而一些成熟的组织已正在利用该技术为企业领导者提供决策支撑。企业基础设施与运维负责人应该尽早启动AIOps平台部署工作,优化当前的性能分析,并在未来两年至五年内扩展至IT服务管理和自动化领域。
(1)健全的用户管理机制:
为解决企业IT系统中普遍存在的因交叉异构、共享账号等运维而产生的无法定责的问题,SSA系统平台提出运维事件收集平台了“集中账号管理“的解决办法;集中帐号管理可以完成对帐号整个生命周期的监控和管理运维事件收集平台,而且还降低了企业管理大量用户帐号的难度和工作量,同时,通过统一的管理还能够发现帐号使用中存在的安全隐患,并且制定统一、标准的用户帐号安全策略。
(2)运维事件事中控制运维事件收集平台:
监控正在运维的会话运维事件收集平台:信息包括运维用户、运维客户端地址、资源地址、协议、开始时间等;监控后台资源被访问情况,提供在线运维操作的实时监控功能。针对运维过程中可能存在的潜在操作风险,SSA根据用户配置的安全策略实施运维过程中的违规操作检测,对违规操作提供实时告警和阻断。
(3)运维事件事后审计:
SSA系统平台能够对常见的运维协议如SSH/FTP/Telnet/SFTP/Http/Https/RDP/X11/VNC等会话过程进行完整的记录,以满足日后审计的需求。审计结果可以录像和日志两种方式呈现。对审计信息SSA系统平台能够根据日常操作、会话报警次数等进行报表统计分析
发表评论
暂时没有评论,来抢沙发吧~