我在 GCP 上部署了一个 Kubernetes 集群,并使用 Stackdriver 来监控 CPU 和内存。Stackdriver 列出了集群中除一个 pod 之外的所有 pod 的统计数据(CPU、内存等)。这种情况已经持续了一周,而那个缺失的 pod 肯定正在运行。奇怪的是,我无法在堆栈驱动程序界面中看到统计数据,但在 GCP 的部署概览中有 CPU 和内存统计数据。
附加信息:
- 该集群有 4 个节点
- 丢失的 pod 正在 ubuntu 上运行 postgres
- 所有其他 pod 都运行 Debian
有任何想法吗?
答案1
我通过在 Ubuntu 容器上启动一个带有 Postgres 的 pod 来重现您的案例,并且可以在 Stackdriver 中看到这个 pod 的统计信息。
您是否确保容器正常运行并且不会在 pod 内永久重启?
我遇到过这种情况,因为 Postgres 容器停止了,因为容器没有处理任何操作来维持其活动。
如果是这种情况,您应该查看容器的入口点,并确保它启动了一个长时间运行的命令,除非它在启动 Postgres 后立即终止。
我希望这有帮助