我在具有 11 个节点的 Linux 集群上运行 microk8s v1.22/stable
。我已启用 metrics-server 插件并通过 Helm chart 安装了 Prometheus,并nodeExporter
启用kubeStateMetrics
了。我获得了所有其他指标,但我注意到 pod 指标(例如container_cpu_usage_seconds_total
)仅适用于在其中一个节点上运行的 pod。我没有注意到这个节点有什么特别之处。
我尝试禁用并重新启用 metrics-server 插件,并spec.template.spec.hostNetwork: true
按照其他地方的建议将其添加到 metrics-server 部署,但无济于事。
运行结果如下microk8s status
:
$ microk8s status
microk8s is running
high-availability: yes
datastore master nodes: ...
datastore standby nodes: ...
addons:
enabled:
dns # CoreDNS
ha-cluster # Configure high availability on the current node
ingress # Ingress controller for external access
metrics-server # K8s Metrics Server for API access to service metrics
storage # Storage class; allocates storage from host directory
disabled:
....
我可能遗漏了什么以及我应该检查什么?