ZooKeeper
ZooKeeper 是一个分布式的,开源的分布式应用程序协调服务,是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。
Cloud Insight 收集 ZooKeeper 管理的服务之间连接响应问题,可视化 ZooKeeper 性能以及和其它应用搭配时性能变化影响。
性能指标
Cloud Insight 采集 Zookeeper 以下性能指标:
指标 | 单位 | 具体含义 |
---|---|---|
zookeeper.bytes_received | 接收的字节数 | |
zookeeper.bytes_sent | 发送的字节数 | |
zookeeper.connections | connections | 客户端连接总数 |
zookeeper.latency.avg | milliseconds | 服务器响应客户端请求花费的平均时间 |
zookeeper.latency.max | milliseconds | 服务器响应客户端请求花费的最大时间 |
zookeeper.latency.min | milliseconds | 服务器响应客户端请求花费的最小时间 |
zookeeper.nodes | nodes | znode 的数量 |
zookeeper.outstanding_requests | requests | 超出服务器处理能力的排队请求数量 |
zookeeper.packets_received | packets/second | 接收的数据包数量 |
zookeeper.packets_sent | packets/second | 发送的数据包数量 |
zookeeper.timeouts | occurrences | Cloud Insight Agent 尝试收集统计信息时的超时速率 |
zookeeper.zxid.count | zookeeper 事务 id,它是选举过程中能否成为 leader 的关键因素,它决定当前 Server 要将自己这一票投给谁(也就是我在选举过程中的 value,这只是其中一个,还有 id) | |
zookeeper.zxid.epoch | 主要用于描述 leader 是否已经改变,每一个 Server 中启动都会有一个 epoch,初始值为 0,当开始新的一次选举时 epoch 加 1,选举完成时 epoch 加 1 |
配置 ZooKeeper 监控
编辑配置文件
编辑配置文件 conf.d/zk.yaml,使 Cloud Insight Agent 可以与 ZooKeeper 通信。
init_config:
instances:
- host: localhost
port: 2181
timeout: 3
重启 Agent
重启 Cloud Insight Agent,使配置生效。
您也可以通过查看 Agent Info 信息,来验证配置是否成功。当出现以下信息,则代表安装成功。
若 Agent Info 指令执行不成功,尝试在 root 权限下执行该指令。
Checks
======
[...]
zk
--
- instance #0 [OK]
- Collected 8 metrics & 0 events
有关 Agent Info 信息的查看,请访问帮助中心,查看 Cloud Insight Agent 常用操作。
常见问题
- 若要在同一个服务器上监控多个相同的平台服务,参考如何监控多个平台服务。
- 有任何关于产品的使用疑惑,参考常见问题。