跳到主要内容
版本:3.7.0

服务

One平台提供完整的服务可观测性。对于安装探针的进程,平台根据服务识别规则(进程组识别规则)自动识别并归类,服务可以基于接口、服务实例的维度分析。

服务识别规则配置可参考 分析核心链路

服务分析

异常定位

运维人员在日常监控中,可通过服务统计气泡图、列表数据,从平均响应时间,错误率,吞吐率等指标数据快速对比,结合告警标识,快速查找严重异常的服务。

alt text

下钻分析

提供查看服务关系、指标、调用链、日志、事件、错误、分析、见解功能。您可以通过查看横纵项关系、指标数据、当前服务捕获的报错信息、平台见解等直观查看服务当前运行的状态。

alt text

关系

横纵项关系可以定位请求来源与请求对象,可以直观了解所在的进程组、容器、主机,以及该服务上识别的接口与关键方法。 更多逻辑说明参考 系统

alt text

指标

  • 查看当前服务各项指标在当前时间段的表现情况。

alt text

  • 可针对指标下钻、关联、追踪,查看相关实体、相关记录(调用链)、相关日志、维度钻取。

alt text

事件

查看当前服务所发生的探针熔断、进程启动、退出、崩溃等事件。

  • 可查看事件的状态、事件来源、事件等级、事件类型。
  • 点击时间可查看单独的事件详情,深入分析事件的属性,进行事件对比等。

alt text

错误

  • 查看请求中发生的错误次数趋势、发生错误的请求次数趋势。
  • 错误列表以错误原因聚合展示当前服务所有的错误记录,一个错误原因可包含多次错误记录。默认按照错误原因查看,可选择按服务实例查看或按接口查看每条记录的错误数、占比、类型。

alt text

  • 点击错误原因可查看对应的错误详情进行错误的深度分析,可查看当前服务在当前时间段的错误趋势、发生的全部错误列表,包括请求地址、错误摘要、入口请求以及对应的主机,可结合错误日志进行准确分析。

alt text

分析

选择对当前服务进行持续分析、链路追踪、拓扑分析、热点方法分析。

  • 持续分析:可点击跳转至持续剖析分析功能,对当前服务进行持续剖析。
  • 链路追踪:对当前服务进行影响分析、依赖分析,查看当前服务相关调用链。
  • 拓扑分析:可点击跳转至全局拓扑功能,查看当前服务的调用关系。
  • 热点方法:可对当前服务进行热点方法分析,详情可查看 热点方法

alt text

见解

查看当前服务的告警情况、健康评分情况、数据采集等情况,且在行动建议中支持您进一步查看分析。

  • 健康评分:查看当前服务的健康评分、各指标的评分占比以及当前时间段的趋势图。
  • 行动建议:可点击进入指标分析功能、健康评分配置功能进行服务指标的深度分析以及健康评分的配置。
  • 数据采集:查看数据的最后监测时间,并点击进入部署状态功能。

alt text alt text

调用链、日志

类似系统下钻的调用链、日志,可查看当前服务相关数据,此处不做赘述,请参考 系统