当前位置: 首页 > news >正文

VMAlert告警规则与动态配置详解

一、功能描述

VMAlert负责执行告警规则、生成告警事件,并将告警推送给 Alertmanager 或 Webhook,同时还能计算 Recording Rule 并写入存储。

在 集群模式下, VictoriaMetrics 具有独立的写入和读取路径组件 。vminsert写入组件用于执行规则表达式,读取vmselect组件用于持久化记录规则结果和警报状态。集群模式可以包含多个写入和读取组件。vmselectvminsertvminsertvmselect

vmalert配置标志:

1. 执行 Alerting Rules(告警规则)

从 Prometheus / VictoriaMetrics 数据源查询数据,周期性评估告警:

alert: HighErrorRate expr: rate(http_errors_total[5m]) > 10 for: 1m

当条件满足 → 触发告警

当条件恢复 → 发送恢复

2. 发送告警通知(Alert notifications)

支持两种方式发送告警:

发送给 Alertmanager(推荐)

走 Alertmanager,再由 Alertmanager 路由到不同通知渠道(Slack、钉钉、飞书、Webhook 等)

直接发送 Webhook(不经过 Alertmanager)

适合自定义告警系统或你这种需要直接推送到接口的情况。

3. 执行 Recording Rules(记录规则)

计算新的时序数据并写入 VictoriaMetrics(remote write):

record: job:http_requests:rate5m expr: rate(http_requests_total[5m])

Recording rules 的好处:

  • 查询速度更快

  • 降低 VictoriaMetrics 计算压力

  • Dashboards 用录制好的指标更顺畅

4. 动态加载规则(不需要重启)

VMAlert 支持:

  • ConfigMap 动态挂载规则

  • 随时 reload,而不重启 Pod

5. 提供 UI 查看规则状态

  • 当前规则执行情况

  • 告警触发状态

  • 执行错误

  • 数据查询结果

二、多个alert实例

需要增加下面参数,用来去重

VM单点模式下

insert和select 增加:dedup.minScrapeInterval: 10s

VM-Cluster 模式下

storage 需要增加 dedup.minScrapeInterval: 15s

select 需要增加 dedup.minScrapeInterval: 15s

数据延迟配置

extraArgs: loggerLevel: INFO rule.evalDelay: "30s" #默认值需要和search.latencyOffset 设置为一致 数据有延迟的时候需要配置

三、监控看板

https://grafana.com/grafana/dashboards/24513-victorialogs-vlagent/

四、全量配置:

apiVersion: operator.victoriametrics.com/v1beta1 kind: VMAlert metadata: name: custom-alert namespace: monitoring spec: replicaCount: 1 imagePullSecrets: - name: uhub-registry datasource: url: "http://vm-victoria-metrics-cluster-vmselect.monitoring:8481/select/0/prometheus" remoteWrite: url: "http://vm-victoria-metrics-cluster-vminsert.monitoring:8480/insert/0/prometheus" remoteRead: url: "http://vm-victoria-metrics-cluster-vmselect.monitoring:8481/select/0/prometheus" maxConnections: 4 image: repository: vmalert tag: v1.128.0 pullPolicy: Always externalLabels: cluster: xxx-prod environment: cn-beijing notifier: url: "http://vmalertmanager-custom-alertmanager.monitoring.svc:9093" timeout: 10s maxConnections: 5 #alertmanager: # enable: true #alertmanagerConfigSelector: # matchLabels: # vmamcfg: custom-webhook #notifier: # alertmanager: # enable: true # selector: # matchLabels: # app.kubernetes.io/name: alertmanager resources: limits: cpu: 2 memory: 4Gi requests: cpu: "100m" memory: "128Mi" #ExternalURL: "https://victoria-alert.xxx.cn" #external: # url: "https://victoria-alert.xxx.cn" extraArgs: loggerLevel: INFO rule.evalDelay: "30s" #默认值需要和search.latencyOffset 设置为一致 数据有延迟的时候需要配置 external.url: "https://victoria-alert.xxx.cn" # 可以将rules存到s3 # rule: s3://bucket/dir/alert.rules serviceMonitor: enabled: true interval: 30s tolerations: - effect: NoSchedule key: service operator: Equal value: sre-victoria-metrics affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: business operator: In values: - sre selectAllByDefault: true evaluationInterval: "30s" scrapeConfigSelector: {} serviceScrapeSelector: {} ruleNamespaceSelector: {} podScrapeSelector: {} nodeScrapeSelector: {} staticScrapeSelector: {} probeSelector: {} ruleSelector: {}

参考文档

https://docs.victoriametrics.com/victoriametrics/vmalert/

https://docs.victoriametrics.com/operator/resources/

http://www.rkmt.cn/news/117252.html

相关文章:

  • 认识睡眠监测仪:科技如何守护你的夜晚
  • ThreadLocal 全解析(Spring Boot 实战篇)
  • 电商主图救星!3个AI换背景技巧,0设计感也能出高点击图
  • AI CRM系统线索打分,原圈科技引爆销售增长
  • 【详解】基于Kubernetes部署Kafka集群
  • 高效监控利器:vmagent全面解析
  • 企业数据迁移中Excel格式异常的5个真实案例
  • 用map方法10分钟搭建数据可视化原型
  • 磁矩表磁计算器
  • 零基础HTML速成:用AI写出你的第一个网页
  • 1小时搞定产品原型:HTML+AI快速验证创意
  • DS二叉排序树之创建和插入
  • 对比评测:雷柏V500Pro键盘宏编程的3种高效方法
  • 2025 最新 PVC管厂家 TOP5 评测!深耕四川、贵州、西藏、重庆,优质服务商权威榜单发布,技术赋能给排水工程新生态 - 全局中转站
  • 二叉排序树的构建与遍历
  • AI教学服务平台开发:让“因材施教”有技术撑腰
  • 江南大学810考研,电子信息和通信工程,集成电路,招生人数,分数线,真题,大纲,参考书。
  • Diffusion Transformer:AI如何革新图像生成开发
  • AI CRM系统升级,原圈科技赋能销售洞察
  • 黑马程序员Java视频教程,一套超哇塞的Java教程,java零基础自学网盘地址免费分享
  • 高性价比之选!20万左右新能源 SUV 核心配置与续航实测
  • 2025 最新克拉管服务商 TOP5 评测!四川、贵州、西藏、重庆等地用户推荐,优质厂商权威榜单发布,品质赋能构建给排水新生态 - 全局中转站
  • 2025最新钢带波纹管厂家TOP5评测!深耕四川、贵州、西藏、重庆,西南、西北基建优选品牌榜单发布,品质赋能市政工程建设 - 全局中转站
  • 2025最新MPP电力管品牌TOP5 评测!服务深度覆盖四川、贵州、西藏、重庆,优质服务商权威榜单发布,赋能电力工程建设新发展 - 全局中转站
  • 基于微信小程序的校园义工系统毕业设计全套源码文档
  • 无线充电系统S - S拓扑仿真:WPT闭环控制探索
  • 零基础学会用AI监控网站链接健康状态
  • 曲速推理机故障排除指南
  • CF587F Duff is Mad
  • 用 Go 像写 Web 一样做桌面应用:完全离线的手机号归属地查询工具