什么会导致出现“取消删除 pod”消息?

什么会导致出现“取消删除 pod”消息?

我每天都会在我的 GKE 日志中看到这些消息几次......

取消删除 Pod <pod-namespace>/<pod name>

看起来它们发生的taint-controller原因是由于TaintManagerEviction

我希望得到以下方面的帮助:

  1. 为什么会发生这种情况?
  2. 当 Pod 首次被标记为删除时,Pod 会发生什么情况?会SIGTERM向其发送消息吗?

我见过这样的情况尽管取消了,但仍被删除/移动到其他节点,甚至立即重新安排到同一节点......

对于它在做什么以及为什么这样做,有什么建议吗?

答案1

我希望你已经找到答案了,因为这是一个老问题。对于任何尚未找到答案的人,这个帖子可能会提供一些见解。它基本上说,如果您的 podtolerationSeconds在其tolerations部分中设置了,您将会遇到这种情况。删除此字段将“解决”此问题。

解释
可以观察到,使用 tolerationSeconds 参数会导致 Pod 同步重新创建。这是一个可选字段,用于指示添加污点后 Pod 将与节点保持绑定的时间。例如,如果将其设置为 6000 秒(1 小时 40 分钟),则 Pod 将与节点保持绑定 6000 秒,然后被驱逐。

相关内容