Kubernetes
Kubernetes作为容器编排领域的核心技术,为用户管理大规模容器化应用提供了强大支撑。在ONE平台中,Kubernetes功能可对cluster、workload、pod等各类对象的信息、状态及资源利用情况进行全面监控,助力用户高效管理与优化Kubernetes集群。它能跟踪对象资源的动态变化,并将其与日志、指标等监控数据关联,为故障诊断和排查提供有力支持。

使用场景
集群管理场景 :当用户需要统一管理多个 Kubernetes 集群时,可通过 ONE 平台的 Kubernetes 功能,查看各集群的节点数量、命名空间数量、资源使用情况等,方便进行集群资源的规划与调度。
应用监控场景 :对于运行在 Kubernetes 集群中的各类应用(如基于 Deployment、StatefulSet 等 workload 部署的应用),用户可利用该功能监控应用相关 Pod 的资源使用、运行状态,以及应用产生的事件和日志,及时发现应用异常。
故障排查场景 :当集群或应用出现故障时,用户可通过查看 Kubernetes 对象的事件和日志,结合资源利用指标,快速定位故障原因,如 Pod 启动失败、资源不足等问题。

开始使用
进入 基础设施->Kubernetes 页面,即可看到k8s的所有对象。

安装部署
点击平台中的【部署监控】按钮,进入安装部署页面。
可选择不同的容器平台(如 Kubernetes、OpenShift、华为云 CCE、阿里云 ACK),设置集群相关信息,包括监控方式(如全栈监控)、集群名称、网络区域等,还可选择技术类型(Java、.NET、Nginx、日志等)。
之后,根据页面生成的安装命令(需确保 kubectl 已安装,且 Kubernetes 版本≥1.9),在 bash shell 中运行,即可添加需要监测的 Kubernetes 集群,轻松完成监控配置。


搜索功能
可选择不同的 Kubernetes 属性(如集群名称、命名空间、Pod 标签等)对 Kubernetes 对象进行筛选,快速查看关注的 Kubernetes 对象。

Kubernetes 对象列表
对象类型展示 :页面左侧会列出监测的 Kubernetes 对象类型和数量,涵盖 Kubernetes cluster、Node、namespace、workload(包含 Deployments、DaemonSets、StatefulSets、ReplicaSets、ReplicationControllers、Jobs、CronJobs 等)、pod、service、Container、Storage(包含 PVC、PV)等。
对象列表查看 :
点击左侧选择关注的 Kubernetes 对象后,页面右侧会显示所选对象的列表。例如:
选择 Clusters,会显示集群名称、Node 数量、Namespace 数量、Workload 数量、Pod 数量、Service 数量以及各类 CPU 相关指标(使用量、使用率、请求量、请求百分比、限制量、限制百分比);
选择 Namespace,会显示 Namespace 名称、CPU 请求量、CPU 限制量、内存使用量、内存请求量、内存限制量、标签、CPU 使用量、Pod 数量等指标。还可在自定义表头中选择关注的对象属性和指标。

Kubernetes 对象详情
点击对象列表中的某一行,可进入 Kubernetes 对象的详情页面:
基础信息 :查看对象的详细信息,涵盖对象的状态,像运行状态(Running、Bound 等);还有 Kubernetes 标签,这些标签可用于标识和分类对象,方便进行资源管理与筛选;以及 Kubernetes 注解,注解能为对象添加额外的元数据信息,助力更细致地了解和管理 Kubernetes 对象。

关系 :支持查看 Kubernetes 对象相关的列表,比如相关的 Pod 列表,可查看 Pod 名称、CPU 使用量、CPU 请求量、CPU 限制量、内存使用量、内存请求量、内存限制量、容器数量、Workload 名称、Namespace 名称、Cluster 名称、Pod 状态等信息,清晰了解对象间的关联。

资源利用 :查看 Kubernetes 对象的关键指标,掌握对象的资源动态变化情况。以 CPU 相关指标为例,可查看 CPU 可分配总量、CPU 限制百分比、CPU 限制量、CPU 请求百分比、CPU 请求量、CPU 闲置量、CPU 使用量、CPU 使用率等随时间的变化趋势,同时还能查看 Namespace 数量、Node 数量、Pod 可分配总数、Pod 数量、Service 数量、Workload 数量、内存可分配总量等指标的变化。

事件 :查看 Kubernetes 对象发生的 Kubernetes 事件,助力故障的诊断、追踪和定位。事件列表会显示事件的时间、类型和描述内容,例如 “Created job superfa - cronjob - 1731304800”“0/1 nodes are available: 1 Too many pods.” 等事件,便于了解集群中事件的发生情况。

日志 :查看 Kubernetes 对象产生的日志,辅助故障的诊断、跟踪和定位。日志内容包含时间戳、日志级别、错误信息、请求 URL 等,如 “upload request http error”“config response http error” 等,可从日志中分析应用运行状况与错误信息。

Kubernetes 事件
在事件 Tab 页可查看 Kubernetes 事件,全面了解集群中各类事件的发生时间、类型和描述内容,事件列表清晰展示,方便用户进行故障排查等操作。

Kubernetes 仪表盘
支持查看 Kubernetes 开箱即用的仪表盘,直观展示不同 Kubernetes cluster 的 Node 数量、不同 Node 或 cluster 的 Pod 数量、容器数量,以及 CPU 使用量 / CPU 可分配、CPU 使用量 / CPU 可分配 Top10 等资源使用情况,便于用户对集群整体状况进行概览。
