怎么监控进程,挂掉的时候可以收到报警?
首先要实现监控具体进程,参考文档配置进程监控。
然后可以配置仪表盘,实时显示进程数据,例如选定某个指标,数据来自 process:xxxx
进程。
关于报警策略的设置,其实和仪表盘配置是一样的,如图:
- 选择性能指标:指标任意选一个
process
的指标,over
选定特定进程,例如process:python
就是监控 Python 进程数据的。 - 设置报警条件:设置一个阈值,达到阈值时会触发报警;此外还可以配置设置数据丢失(进程挂了自然也就不会再发送数据)时,直接发送报警邮件。
- 再下面,就是命名报警和通知用户了。