跳到主要内容

AI 预测

信息

AI 预测告警基于历史数据对指标走势进行预判,在指标尚未超限之前提前发出告警。与实时阈值告警不同,它面向未来时间窗口,适用于容量规划、资源提前预警等需要留出处置时间的场景。

快速上手

第一步:进入新建页面

进入 告警规则 ,点击 新建告警规则 ,选择 AI 预测检测类型后进入配置页。

第二步:配置检测规则

  1. 生效范围中选择资源域
  2. 指标选取中选择目标指标、聚合函数和分组维度
  3. 触发条件中设置预测时间窗口(未来 N 天)和比较方式,并填写各级别绝对值阈值
  4. 按需配置 聚合规则 ,指定按哪个维度合并告警

第三步:填写告警内容

  1. 填写 告警标题 ,支持使用变量
  2. 按需编辑 通知内容 ,或保留默认模板
  3. 选择 通知策略 ;如未创建,点击创建通知策略

第四步:设置生效时间并保存

  1. 选择 生效时间 (默认全天 7×24 小时)
  2. 确认启停状态已开启
  3. 点击保存完成创建;如需复用,点击保存至自定义模板

功能说明

1777021214804

检测规则

基础配置

字段是否必填说明
生效范围选择本条规则监控的资源域,规则仅对所选范围内的数据生效
指标选取选择被监控的指标、聚合函数(如平均值、最大值)和分组维度(如按主机拆分),决定 AI 对哪条时间线进行预测

触发条件

AI 预测模式下,检测对象是 未来时间窗口内的预测值 ,而非当前实时数据。阈值为绝对数值。

字段是否必填说明
预测时间窗口未来 N 天内,如果指标的预测数据满足条件则触发告警。时间越长,预警越提前,但预测不确定性也越高
比较方式支持 >< 等操作符,与各级别阈值组合判断是否触发
致命阈值若预测值满足条件,产生致命级别告警
严重阈值若预测值满足条件,产生严重级别告警
警告阈值若预测值满足条件,产生警告级别告警
正常恢复连续 N 次检测预测值不再满足条件,告警自动恢复为正常状态,默认 3 次

高级配置

字段是否必填说明
数据断档开启后,当检测区间内完全没有历史数据导致无法预测时也触发告警。默认关闭
数据延时开启后,查询时间窗口整体后移指定时长,避免因数据入库延迟影响预测准确性。默认开启 ,偏移1 分钟
聚合规则指定按哪个维度对多条时间线合并告警(如按主机),使同一维度下的多个预测结果合并为一条告警,减少重复通知

告警内容

字段是否必填说明
告警标题告警触发时显示的标题,支持变量动态填充,例如 主机${host}${metric}告警
通知内容发送给接收人的正文,支持富文本编辑和变量插入。不填则使用默认模板,包含:${alertId}${startTime}${alertName}${level}
通知策略指定告警触发后通知谁、用哪种渠道。未配置时告警仅记录,不发送通知
Labels为规则添加自定义标签,便于分类筛选与批量管理

状态 & 生效时间

字段是否必填说明
生效时间全部时间 (7×24 小时):规则始终运行; 周期时间 :按周几重复生效; 自定义时间 :指定具体时间段。默认全部时间
启停状态开启时规则正常检测并产生告警;关闭时规则暂停,不产生任何检测和通知。默认开启

常见场景

场景:磁盘容量提前预警 选取磁盘使用率指标,聚合函数选最大值,设置预测时间窗口为 未来 3 天 ,当预测值 > 85% 触发 警告 、> 95% 触发 严重 ,在磁盘写满前提前收到通知,留出扩容或清理时间。

场景:业务流量预判,提前扩容 选取请求量指标,设置预测时间窗口为 未来 1 天 ,配合节假日或大促前的业务节奏,当预测峰值超过系统处理上限时提前触发告警,驱动自动或手动扩容决策。

场景:多主机分组预测告警 在指标选取中设置分组维度为主机,配合聚合规则按主机合并,系统将为每台主机分别建立预测模型并独立触发告警,避免多台主机告警信息混合。

注意事项

信息

页面顶部的检测数据图表会同时展示历史实测曲线(实线)和 AI 预测走势(虚线 + 绿色区间)。保存前可通过图表直观判断预测趋势是否符合预期,辅助校准阈值。

提示

预测时间窗口建议根据处置周期来设定:如果扩容或修复需要 1 天,则预测窗口设为 1–2 天;窗口过长会引入更多不确定性,导致误报增加。

注意

AI 预测依赖充足的历史数据 。对于数据量不足或采集时间较短的指标,预测准确性有限,建议至少积累 2 周以上的历史数据后再启用预测告警。