功能概述
核心链路是指支撑企业关键业务活动的、一系列相互依赖和调用的软件系统与服务所组成的关键路径节点。这些路径的稳定性和性能直接决定了核心业务的可用性与用户体验。 例如,一次成功的“在线支付”业务,可能依赖于“用户服务”、“风控系统”、“支付网关”、“账户系统”等多个服务的协同工作。这条包含多个服务节点的调用链条,就是一条核心链路。如果其中任何一个环节出现故障或性能瓶颈,都会直接导致支付失败或延迟,对业务造成直接影响。
核心链路功能正是为了对这些至关重要的业务路径进行端到端的、可视化的、深度可观测的监控而设计。
核心链路vs调用链
-
关注焦点:调用链关注技术视角,追踪一次分布式请求的完整路径,详细记录其经过的所有服务、数据库调用等技术细节,用于性能瓶颈和故障根因分析。核心链路关注业务视角,将多个系统或服务按业务逻辑编排成一个完整的流程,旨在监控整个业务的健康度和可用性。
-
数据视角:调用链是微观且离散的,它展示的是无数个独立的请求轨迹。核心链路是宏观且聚合的,它从大量调用链数据中提炼出关键指标,并聚合展示在业务拓扑图上,反映整体状态。
-
构建方式:调用链是自动生成的,由系统自动采集和上报每一次请求的轨迹数据,反馈最真实的调用场景。核心链路支持人工编排,且不会因为调用链动态发生变更,需要用户根据业务架构手动绘制拓扑图并配置关键指标。故调用链是动态的运行数据。核心链路是静态的链路架构,反馈动态的行为数据。
相关术语
- 核心链路:由一系列相互关联的服务或系统组成,若出现问题会直接影响业务的可用性。如:交易、登录、转账等。
- 节点:在核心链路拓扑图中代表一个被监控的实体,通常指在画布上编排的系统或服务。
- 关键指标:也称为北极星指标,是衡量业务或服务健康度最核心的指标,可自定义。
- 纵向架构:描述一个服务或系统其底层基础设施的部署与依赖关系,通常自上而下为:系统 -> 服务 -> 服务实例 -> 容器 -> 主机,该视图支持自定义层级。
- 告警等级:标识告警严重程度,包括:致命、严重、警告、一般、提醒。可配置哪些等级被视为“异常”状态。
- 告警规则:ONE平台的告警规则,可选择已配置的告警规则与核心链路关联,根据触发的告警情况监控链路。
- 环比:当前时间段与上一个相邻时间段(如本周与上周,今天与昨天)的数据对比值,用于快速判断指标波动情况。
- 健康墙:指核心链路监控功能的全局总览界面,通过颜色染色和关键数据集中展示,提供所有核心业务链路健康状态的直观感知能力。
监控流程
核心链路监控流程依托于ONE平台智能可视化、层级下钻与数据关联三大核心能力,通过健康墙的颜色告警直观感知业务异常,并沿“业务-服务-基础设施”的层级路径逐层深入定位故障点,以及在集成视图中关联分析指标、日志及调用链等数据快速确定根因,形成从发现问题到验证恢复的高效闭环。
聚焦场景

- 问题发现:在日常监控中,通过核心链路健康墙集中查看所有链路状态,利用颜色直观识别异常业务,实现快速感知和问题发现。
- 初步定位:发现异常后下钻至链路详情页,通过拓扑视图快速定位异常服务节点,确定故障影响范围。
- 关联影响分析:进一步下钻至服务详情页,结合纵向架构和各类观测数据定位异常实例并分析根因,同时评估全局影响。
- 启动应急:将核心链路监控视图作为应急协同基础,确保团队基于统一态势进行故障处理和恢复。
前提条件
- 数据接入完备:确保您需要监控的系统与服务已接入ONE平台,并能稳定上报指标(Metrics)、日志(Logs) 和调用链(Traces)等数据。
- 功能权限:您的账号需要被授予核心链路、纵向架构的相关查看或者编辑权限。
快速入门
- 创建链路:进入观测洞察->核心链路,点击「创建」按钮。输入链路名称(如“核心交易业务”)并保存,进入编排页面。
- 编排链路:选择关键业务中涉及的系统或服务添加到画布中,并串联已添加的节点。
- 配置监控:配置关键接口、关键指标、告警规则等并保存。
- 查看监控:在健康墙或链路详情页可查看到核心链路以及核心链路节点的健康状态。