跳到主要内容

AI 服务分析

对接入监控的 AI 服务进行统一管理与观测,支持查看请求、性能、Token 消耗、模型调用及告警等多维度数据


核心能力

  • 应用总览:在列表页集中查看所有 AI 服务的请求次数、错误率、响应时间、Token 消耗等关键指标,快速定位异常应用
  • 调用链分析:逐条查看每次 AI 调用的 Input/Output 内容、响应时间与状态,支持按应用名称、Trace ID、用户 ID、会话 ID 过滤
  • 性能视图:聚合展示 AI 服务的响应时间、请求次数、错误次数及模型请求数,并提供趋势图对比昨日变化
  • Token 视图:统计 AI 服务总 Token 消耗,并按模型维度分析 Input/Output Token 分布及消耗趋势
  • 模型视图:以模型为维度汇总调用次数、平均耗时、错误次数和 Token 消耗,支持多模型横向对比
  • 告警集成:在应用详情内直接查看关联告警,按级别(致命 / 严重 / 警告 / 一般 / 提醒)和状态筛选,支持关闭与导出

场景举例

  • 发现高错误率应用:在应用列表发现某应用请求错误率突增,点击进入详情,通过调用链分析定位具体失败请求的 Input/Output 内容
  • 监控 Token 成本:通过 Token 视图查看各模型的 Input/Output Token 消耗分布,识别消耗异常的模型,辅助成本优化决策
  • 多模型性能对比:在模型视图中对比同一应用下不同模型的响应耗时和错误率,选择最优模型配置

功能介绍

AI服务列表

列表展示所有已接入 AI 服务的核心指标,包括请求次数、请求错误率、平均响应时间、总 Token 消耗、丢弃 trace 数、每分钟错误发生次数、吞吐率、采集 trace 数、错误次数、错误请求次数及最后监测时间。您可以按应用名称搜索,支持数据导出。

应用详情

点击应用名称进入详情页,顶部展示应用健康状态、监控时长、最近上报时间、关联服务实例,以及请求次数、请求错误率、平均响应时间、Token 用量、相关模型调用 TOP3 五项核心指标卡(含日同比变化)。详情页包含以下六个子页面.

调用链分析

列表展示每条 AI 调用记录的发生时间、状态、响应时间、Input 内容、Output 内容及 Trace ID,可按应用名称、Trace ID、用户 ID、会话 ID 进行筛选。点击发生时间可跳转至完整 Trace 详情。

会话分析

列表展示AI 服务的会话记录,持续时间,会话ID、token消耗、包含trace数等。点击发生时间可跳转至完整 会话分析 详情。

性能视图

展示应用性能总览,包含 AI 服务平均响应时间、请求错误次数、请求次数、模型请求次数四项总览指标,及对应的响应时间趋势、错误趋势、请求次数趋势图,支持按实例 ID 筛选。

Token 视图

展示 Token 消耗总览,包含 AI 服务总 Token 消耗、模型总 Token 消耗分布、模型 Input Token 消耗分布、模型 Output Token 消耗分布,以及 AI 服务 Token 消耗总览趋势图和模型 Token 消耗总览趋势图。

模型视图

以模型为维度展示总览数据,包含模型调用次数、模型响应平均耗时、模型错误调用次数、Token 消耗四项指标,并在模型分析区域展示各模型的详细对比数据。

告警

展示与该应用关联的所有告警,按致命、严重、警告、一般、提醒五个级别分类汇总,左侧提供按状态(已恢复 / 告警中 / 无数据 / 已关闭)和规则类型(阈值检测 / 日志 / 事件)筛选。每条告警显示名称、级别、状态、发生时间、持续时间及通知方式,支持批量关闭和导出。

特殊说明

数据前提:AI 服务数据依赖探针采集,需确保探针版本 ≥ 9.13.0 且 AI 调用监控已开启,否则列表为空。

日同比说明:详情页指标卡中的日同比数据为与昨日同时段的对比,时间范围变化会影响对比结果。

模型视图数据:模型分析需要有模型调用数据,若暂无数据,各指标卡将显示"暂无数据"。

告警关联:告警页仅展示与当前 AI 服务相关联的告警,如需管理告警规则,请前往智能告警模块进行配置。

Trace 跳转:调用链分析列表中点击发生时间,可跳转至完整的 Trace 链路详情页进行深度排查。