主机
ONE平台通过SmartAgent,及SmartGate可采集主机、容器、进程组、技术组件等基础设施数据,帮助您快速了解基础设施资源消耗情况,发现基础组件的性能瓶颈,提前评估、规划基础组件的数量和配置。
前置条件
若要使用平台的主机监控能力,需要先安装平台探针SmartAgent、SmartGate。具体安装方法可参考探针安装。
使用场景
- 服务器集群管理:在企业数据中心或大规模服务器集群环境中,众多主机承担着不同业务(如 Web 服务、数据库服务、计算任务等)。通过主机监控,可实时掌握每台主机的运行状态
- 业务系统稳定性保障:持续监控主机上关键服务(如数据库服务、中间件服务)的运行状态,确保服务始终可用。若服务进程意外停止,监控系统可自动触发告警并尝试重启服务。
开始使用
1、进入基础设施 -> 主机 页面,可查看当前通过探针采集的主机列表,主机支持列表及蜂窝图展示

2、列表展示形态下,支持展示主机的基本信息及主机指标数据。可通过自定义表头能力展示自己更关注的信息。

3、蜂窝图默认展示当前平台内在线的主机,同时根据所选指标对蜂窝进行染色,可通过右上角设置更改染色指标。同时点击对应的蜂窝可展示主机的详细属性信息。

4、针对单体主机的更多信息,提供查看可用状态、关系、仪表盘、指标、事件、见解、分析功能。您可以通过查看主机从下到上的所有实体(包括容器,进程,服务)依赖关系,横向调用关系,比如某些主机上的服务实例调用过该主机上的服务实例。详情页默认展示关系视图。可查看当前主机上运行的进程、容器、服务等归属关系。
内置实践仪表盘,支持CPU、内存、磁盘、网络、主机上的进程多个维度观测主机资源使用情况。内存使用率支持两种计算方式,满足各种运维场景的使用。
事件,可查看主机最近发生的运维重点事件,包括探针熔断,进程启动、退出、崩溃、主机重启等。
针对该主机可以获取个性化的见解,最近一周的主机健康评分,已经健康评分的趋势变化。主机上发生过的部署变更。以及主机上最近7天,容器、进程、磁盘等关键指标的排行情况,帮助您分析资源占用最高的实体。
