我正在追踪我们集群中一个未知的超时问题,发现了一些有趣的事情。
我们目前有 30 个 Pod 用于一项服务。当我运行时,kubectl get event
这 30 个 Pod 一直处于就绪状态失败。它们所有的“LASTSEEN”都少于 10 分钟,并且一直在失败。
但我仍然可以毫无问题地访问该服务。
我认为 Kube 会删除那些未能就绪的 Pod,使其无法被访问。
为什么我仍然可以访问该服务?我仔细检查了一下,发现每个服务每隔 10 分钟左右仍然会失败一次。
我正在追踪我们集群中一个未知的超时问题,发现了一些有趣的事情。
我们目前有 30 个 Pod 用于一项服务。当我运行时,kubectl get event
这 30 个 Pod 一直处于就绪状态失败。它们所有的“LASTSEEN”都少于 10 分钟,并且一直在失败。
但我仍然可以毫无问题地访问该服务。
我认为 Kube 会删除那些未能就绪的 Pod,使其无法被访问。
为什么我仍然可以访问该服务?我仔细检查了一下,发现每个服务每隔 10 分钟左右仍然会失败一次。