跳转至

故障管理


睿象云智能告警平台故障管理从管理维度上可以把零散的告警串联起来,方便用户了解告警产生的原因。从运维角度上,通过故障下关联告警信息可以清晰的了解一个故障的影响范围。


故障配置流程

  • 创建故障分派策略

新建分派策略:输入分派名称,勾选是否为故障,选择分派人,按需设置升级策略;

说明

  • 关于工作空间:可选项,选择后此分派策略仅对该工作空间生效
  • 针对故障的处理流程是独立于告警的,其中的告警走依然走告警的处理流程
  • 生成故障

在告警-告警列表中选择一条或多条告警,点击生成故障

填写故障名称故障描述故障级别选择分派策略,以及后续发生的告警归属到此故障的规则信息

说明

  • 选择工作空间后,此故障将仅对该工作空间的告警有效
  • 后续发生的告警归属到此故障的规则信息:后续符合此故障规则的告警,将与此故障关联

可以点击添加告警至故障图标,手动添加某些告警归属到某一个故障中

  • 定义故障通知策略

配置-通知策略-故障策略配置,点击添加按钮,配置故障通知策略。

  • 设置协作方式故障通知

点击集成-协作集成


故障管理功能说明

  • 列表视图说明

点击左侧菜单-故障管理

功能面板示意说明

  • 操作区:依次 合并、认领、转发、关闭、重开、编辑
  • 展示区:依次 级别,名称,状态,故障内告警关闭后X分钟内无新的告警发生,系统将自动关闭此故障,故障持续时长,工作空间,当前处理人,创建时间

不同状态支持不同操作说明

  • 待处理 支持 合并、认领、转发、关闭、编辑
  • 处理中 支持 合并、转发、关闭、编辑
  • 重开 支持同处理中
  • 关闭 支持 合并 重开
  • 故障详情说明

点击故障名称,进入故障详情页

故障详情面板示意说明

  • 详细信息及操作区:可以看到故障详情信息及其可支持的操作
  • 知识沉淀:可以针对故障的描述,根因及解决方案做详细的说明
  • 卡片功能区:规则详情、关联告警、处理记录
  • 关联告警:默认展示最近7天的待处理告警
  • 处理记录:针对故障的处理流程和操作会有详细记录