microk8s：并非所有节点都提供 pod 资源使用情况指标

2024-6-1 • tag-icon

我在具有 11 个节点的 Linux 集群上运行 microk8s v1.22/stable。我已启用 metrics-server 插件并通过 Helm chart 安装了 Prometheus，并nodeExporter启用kubeStateMetrics了。我获得了所有其他指标，但我注意到 pod 指标（例如container_cpu_usage_seconds_total）仅适用于在其中一个节点上运行的 pod。我没有注意到这个节点有什么特别之处。

我尝试禁用并重新启用 metrics-server 插件，并spec.template.spec.hostNetwork: true按照其他地方的建议将其添加到 metrics-server 部署，但无济于事。

运行结果如下microk8s status：

$ microk8s status
microk8s is running
high-availability: yes
  datastore master nodes: ...
  datastore standby nodes: ...
addons:
  enabled:
    dns                  # CoreDNS
    ha-cluster           # Configure high availability on the current node
    ingress              # Ingress controller for external access
    metrics-server       # K8s Metrics Server for API access to service metrics
    storage              # Storage class; allocates storage from host directory
  disabled:
    ....

我可能遗漏了什么以及我应该检查什么？

相关内容