浪潮信息创新运维管理解决方案,助力智算平台实现精确纳管

网友投稿 702 2022-12-05

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

浪潮信息创新运维管理解决方案,助力智算平台实现精确纳管

中南大学智算平台作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,拥有高达上千台各种类型的计算服务器,在满足科研人员大量计算资源需求的同时,大量集中部署的计算服务器集群对管理和运维人员提出了新的挑战。基于传统运维模式既无法实现对计算集群快速而精准的有效运维,也造成了运维人力资源的沉重负担。对此,浪潮信息提出了以自研ISPIM(Inspur Physical Infrastructure Manager)浪潮信息物理基础设施管理平台为核心的自动化运维解决方案。

在方案设计过程中,浪潮信息研发工程师通过实地考察、调研并与中南大学HPC平台管理和技术人员进行多次反复的交流、沟通和分析、研究,最终决定以“1+1+N高可用模式”,在5台服务器上部署ISPIM系统,主动采集频率为45min,监控指标可达150W+,覆盖智算平台内的所有设备。得益于浪潮信息ISPIM平台丰富、强大的功能,在部署浪潮信息的自动化运维解决方案后,中南大学智算平台不仅大大减轻了运维负担,算力的管控也更加集中化、智能化;同时,运维人员还能够通过浪潮信息ISPIM平台随时随地监控整个平台的运行状态,实现能耗可查、可管、可控。另外,由于ISPIM平台故障报警能够以秒级的速度精准定位,中南大学智算平台的高效有序运转从而得到了进一步的保障。

上一篇:巡检机器人投运意义深远 运维即将进入AI时代
下一篇:浅谈智能供配电系统的定义、特点、优势及价值
相关文章

 发表评论

暂时没有评论,来抢沙发吧~