tag 使用指南
Cloud Insight 用 tag 来使用户迅速查询要监控的服务器和指标。如果你想发现环境中存在的问题,那么必须要确定范围缩小范围,那么就需要的分配和过滤服务器或指标,而这就是 tag 所能够实现的。
如何配置 tag
目前有两个主要的方法来配置 tag:
- 在配置文件中
- 在前端界面中
使用配置文件配置 tag
Cloud Insight 是通过修改 YAML 配置文件进行配置的。您可以在配置文件中给整个服务器定义 tag ,也可以是某个组件。无论在哪种情况下,都会在那个等级上有 tag 字典的列表 。您在服务区上所配置的所有 tag 将应用于该服务器上的每一个组件。
key:value
格式的字典有2个不同的功能等价形式:
tags: firsttag, secondtag, third tag
和
tags:
- firsttag
- secondtag
- thirdtag
在配置文件中也都可以看到这两种形式,当然配置时要注意遵循 YAML 格式。
每一个 tag 都可以是你喜欢的任何东西,但如果你的 tag 很关键(高度可读),那最好用标准方式标记:key:value
。key 可以代表角色,或功能,或区域,或应用程序,该 value 是该角色、功能、区域或应用程序的实例。下面是一些很棒的 tag 例子:
region:east
region:nw
application:database
database:primary
role:sobotka
当你开始使用 tag 将指标和服务器进行过滤和重建群组时,采样 key:value
格式就会感觉到其魅力所在了。
前端界面配置 tag
你可以在平台概览页面对所有平台设置 tag,在平台标签处点击编辑标签即可。
怎么使用 tag
上面具体列出了怎么在服务器和组件上配置 tag,那具体怎么通过聚合分组筛选来使用 tag,目前可以在以下方面使用 tag:
- 平台分组
- 仪表盘配置
- Hostmap
- 报警策略
- 事件流
仪表盘
仪表盘进行聚合分组功能时就是依赖 tag 来进行的,如下图显示的是有 os:ubuntu
这个 tag 的服务器的 system.disk.free
的平均值。
报警策略
设置报警条件时直接用 tag 进行设置,无需一一添加服务器,将要监控的服务器的统一 tag 放上去,下图的报警策略就是:有 os:ubuntu
tag 的服务器 system.mem.used
总和在5分钟内至少有一次大于等于 7G 就触发报警。
Hostmap
在 hostmap 里面通过添加不同 key 来对服务器进行分组过滤,这样如果某个服务器某个组件有问题,你可以在分完组的界面里直接看到,确定是数据库问题还是 DNS 问题,而且即使是混合云依旧可以这样放在统一界面进行展示。