服务探针
服务探针是ONE平台用于对服务进行监测的关键组件,能够实时采集服务运行时的各项数据,如响应时间、请求错误率、吞吐量等。通过服务探针,用户可以精准掌握服务的运行状态,及时发现服务异常,为服务的优化、故障排查等提供有力的数据支撑,助力保障服务的高可用性与稳定性。

前置条件
使用服务探针功能,需确保服务已正常部署且网络环境稳定,能够支持探针与平台之间的数据传输。同时,对于 Java 探针,需保证环境支持 Java 相关运行要求(当前仅支持 8.15.0 及以后版本 Java 探针的销毁操作等特定版本相关操作)。
使用场景
服务监控与状态感知 :在日常服务运维中,可通过服务探针实时查看服务的运行状态(如在线、熔断、离线等),以及各项性能指标(响应时间、错误率等),随时掌握服务是否正常运行。
故障排查与问题定位 :当服务出现响应缓慢、错误率升高等问题时,利用服务探针采集的详细数据,结合调用链、日志等信息,能够快速定位到问题发生的环节与原因,如某一接口调用超时、某段代码异常等。
资源管理与优化 :通过观察服务探针的资源占用等相关数据,可了解服务对系统资源的消耗情况,进而对服务进行资源分配调整或代码优化,提升服务性能与资源利用效率。
服务版本更新与变更验证 :在服务进行版本更新或配置变更后,借助服务探针监测各项指标的变化,验证更新或变更是否达到预期效果,是否引入新的问题。


开始使用
通过系统导航栏进入 部署配置 → 部署状态 → 服务探针 ,即可打开服务探针管理界面。
查看探针状态
查看服务探针:进入服务探针界面后,默认展示隐藏离线7天以上的探针列表,便于管理员快速掌握服务探针的整体分布和基本情况(如 所属服务、IP、探针类型等),为后续的监控和管理操作提供基础。其中“探针状态” 列展示了探针的当前状态,各状态含义如下:
- 在线 :探针正常运行,能够正常上报数据。
- 禁用 :探针已被禁用,不会上报数据,原因可能是未启用该探针或 Pod 监控规则限制了探针的数据上报。
- 熔断 :触发了熔断机制,平台会控制探针停止上报数据。
- 离线 :可能由于网络、线程挂掉等原因导致无法感知到探针。
通过查看探针状态,可快速判断探针是否处于正常工作状态,以便及时对异常状态的探针进行处理。


查看探针详情:点击探针名称进入详情页可查看以下核心数据,为管理员提供服务实例的全维度运行数据,助力管理员排查性能瓶颈(如响应时间过长)、定位故障原因(如请求错误率上升),优化服务运行效率。详细核心数据可参考服务实例。
- 服务健康度:最近 24 小时运行状态、Apdex 值、错误日志数。
- 性能指标:平均响应时间、请求错误率、请求次数、吞吐率(支持趋势图查看)。
- 关联数据:资源占用、调用链、日志、事件、错误、进程等多维度明细,以及相关指标的变化趋势。

搜索探针
在服务探针界面的搜索框中,可输入探针名称进行搜索,也可通过下拉选项选择按主机 IP、主机名称、所属服务等多种维度进行筛选,快速定位到目标探针,方便对特定探针进行查看或操作。

启用/禁用探针
在探针列表的 “启用” 列,通过点击开关按钮,可对探针进行启用或禁用操作。启用探针后,探针将正常工作并上报数据;禁用探针后,探针停止数据上报。

销毁探针
在探针列表的 “操作” 列,点击 “销毁” 按钮,会弹出确认销毁的对话框,提示 “探针销毁后,无法重新启用,需要重新启动服务才能重新监测,是否确认销毁探针”,点击 “确认销毁” 完成操作,点击 “取消” 则放弃销毁。
销毁操作会将探针所在的线程杀死,避免资源紧张时占用资源。建议同步将监控规则禁用,否则重启服务后会再次部署探针。且当前仅支持 8.15.0 及以后版本 Java 探针的销毁操作。


自定义表头
点击界面中的自定义表头按钮,会弹出 “可选自定义表头” 和 “已选自定义表头” 对话框。
在 “可选自定义表头” 中,勾选需要显示的属性(如探针名称、所属服务、主机 IP 等),这些属性会被添加到 “已选自定义表头” 中;也可在 “已选自定义表头” 中取消勾选,移除不需要显示的属性。设置完成后,点击 “确定”,探针列表的表头将按照自定义的内容进行显示,方便用户查看关注的信息。
