Alertmanager 配置
Alertmanager 中关于配置文件有三大块内容:告警路由配置、告警接收者配置、告警抑制规则配置
告警路由
路由可以根据标签使得不同的告警发送给不同的告警渠道,配置好告警路由可以精确发送告警信息
例子
route: # 顶级路由
receiver: "ops" # 默认的告警路由接收者(所有的子路由都没有匹配到)
group_wait: 30s
group_interval: 5m
repeat_interval: 4h
group_by: [product, alertname]
routes: # 子路由(可以多个子路由)
# 这个子路由的意思是所有告警标签中匹配到service=mysql 或者service=cassandra的告警,都发送给dba
- receiver: "dba"
group_wait: 10s
matchers: # 标签匹配可以正则也可以精确
- service=~"mysql|cassandra"
告警通知
告警通知,就是定义一些告警接收者用来接收告警信息
常用的
- slack_configs
- wechat_configs
- webhook_configs
例子:我们一般常用 webhook
receivers:
- name: ops # 告警接收者的名称
webhook_configs:
- send_resolved: true # 是否发送恢复的告警信息,默认是true
url: http://127.0.0.1:5001/ # webhook的URL地址
- name: dba
webhook_configs:
- send_resolved: true
url: http://127.0.0.1:5001/
告警维护
顾名思义,就是维护告警,在 Alertmanager 中有三种方式,一种是通过页面,一种是通过 API 来操作,一种通过工具来操作