Alertmanager 配置

Alertmanager 中关于配置文件有三大块内容:告警路由配置、告警接收者配置、告警抑制规则配置

告警路由

路由可以根据标签使得不同的告警发送给不同的告警渠道,配置好告警路由可以精确发送告警信息

例子

route: # 顶级路由
  receiver: "ops" # 默认的告警路由接收者(所有的子路由都没有匹配到)
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 4h
  group_by: [product, alertname]
  routes: # 子路由(可以多个子路由)
    # 这个子路由的意思是所有告警标签中匹配到service=mysql 或者service=cassandra的告警,都发送给dba
    - receiver: "dba"
      group_wait: 10s
      matchers: # 标签匹配可以正则也可以精确
        - service=~"mysql|cassandra"

告警通知

告警通知,就是定义一些告警接收者用来接收告警信息

常用的

  • slack_configs
  • wechat_configs
  • webhook_configs

例子:我们一般常用 webhook

receivers:
  - name: ops # 告警接收者的名称
    webhook_configs:
      - send_resolved: true # 是否发送恢复的告警信息,默认是true
        url: http://127.0.0.1:5001/ # webhook的URL地址
  - name: dba
    webhook_configs:
      - send_resolved: true
        url: http://127.0.0.1:5001/

告警维护

顾名思义,就是维护告警,在 Alertmanager 中有三种方式,一种是通过页面,一种是通过 API 来操作,一种通过工具来操作

上次更新:
贡献者: kongzZ