跳到主要内容
版本:3.7.0

分析核心链路

本文描述如何利用健康墙、拓扑下钻、纵向架构以及多维数据关联能力,完成对核心链路的分析。

分析流程

核心链路的视图分为统计、拓扑、列表三种视图。

统计

以卡片形式展示所有创建的核心链路,可根据卡片颜色、告警标识、关键指标、告警规则、告警数等监控核心链路的状态。支持编辑、克隆、配置关键指标、关联告警规则、删除核心链路。

alt text

异常状态配置:点击过滤框旁的异常状态配置,根据业务需要将指定的告警等级归为异常,告警状态包括:致命、严重、警告、一般、提醒,可手动选择对应告警等级为异常状态(至少勾选一个等级),此时核心链路渲染、告警等级查询范围都受此规则控制。如:勾选告警等级致命为异常状态,则核心链路相关渲染以及告警标识除致命等级外都为正常。

告警查询范围:根据配置的异常状态,查询当前核心链路关联的所有实体相关的告警,进行核心链路的告警渲染和标识。

alt text

  • 卡片颜色:异常状态的卡片会渲染为红色, 正常状态的卡片为灰色。
  • 告警标识:卡片左上角展示异常核心链路的告警等级。
  • 关键指标:点击卡片右上角编辑按钮,选择配置关键指标,可对当前核心链路配置关键指标。
  • 关联告警规则:点击卡片右上角编辑按钮,选择关联告警规则,可为当前核心链路关联告警规则,点击卡片上的关联告警规则,可查看已关联的所有告警规则。
  • 关联告警数:此处的告警数指核心链路关联的告警规则触发的告警数量,点击卡片上的关联告警数,可查看触发的所有告警情况。

拓扑

以拓扑卡片形式展示所有创建的核心链路,已编排的核心链路展示为当前拓扑的缩略图。渲染效果同统计视图,支持编辑、克隆、配置关键指标、关联告警规则、删除核心链路。

alt text

列表

以列表形式展示所有创建的核心链路,展示当前链路的告警情况,支持编辑、克隆、配置关键指标、关联告警规则、删除核心链路。

alt text

发现问题(以统计视图为例):

根据告警渲染快速发现异常的链路,步骤如下:

  1. 进入观测洞察->核心链路页面
  2. 通过核心链路卡片颜色、告警等级标识等,识别异常状态的核心链路。
  3. 可关注"异常链路清单”和“服务异常影响链路数TOP5”图表,辅助评估故障影响范围。

alt text

下钻定位

定位导致链路异常的节点,步骤如下:

  1. 选择异常的核心链路,点击卡片进入该核心链路详情页。
  2. 查看顶部关键指标的趋势图,确认链路关键指标(如成功率、耗时)的异常情况。
  3. 通过链路拓扑显示的异常状态识别异常节点。

其余辅助分析手段:

  • 查看当前链路关联持续中的告警情况。
  • 查看当前链路所有的异常实体,点击一键定位至此节点。
  • 查看链路节点的指标情况。

alt text

根因排查(以服务节点为例)

点击异常节点进入链路节点详情页,进行多维数据分析。

纵向架构

数据统计

  • 根据实体类型统计当前纵向架构关联实体数量
  • 统计当前节点的纵向架构关联的持续中告警,可查看具体告警情况
  • 统计当前纵向架构出现异常的实体,点击定位异常实体

拓扑图分析

  1. 直观查看当前节点的纵向层级关系,如:系统->服务>服务实例->进程->主机,通过颜色识别异常的节点
  2. 点击异常的节点可查看节点详情,进行深度分析
  3. 分析异常节点的指标、日志、调用链、告警等情况

alt text

指标

查看当前服务下所有的指标情况。

alt text

接口

查看当前服务下所有关联的接口情况。

alt text

告警

查看当前服务下关联的告警情况。

alt text

日志

查看当前服务下关联的日志情况。

alt text

调用链

查看当前服务下关联的调用链情况。

alt text

调用关系

查看当前服务的横向调用关系。

alt text

自定义视图

  1. 点击「添加视图」,选择已有的仪表盘视图或自定义视图
  2. 设置视图生效范围
  • 全局:所有核心链路的服务节点详情页都生效(限制技术类型)
  • 本实例:只在当前服务节点详情页生效
  1. 设置视图是否默认展示,控制进入当前节点详情页是否默认展示此自定义视图

alt text

恢复验证

根据逐步分析,定位异常并进行处理,若解决措施有效,异常状态解除,关注相关告警是否关闭、指标数据是否恢复正常趋势。