我每天都会在我的 GKE 日志中看到这些消息几次......
取消删除 Pod <pod-namespace>/<pod name>
看起来它们发生的taint-controller
原因是由于TaintManagerEviction
我希望得到以下方面的帮助:
- 为什么会发生这种情况?
- 当 Pod 首次被标记为删除时,Pod 会发生什么情况?会
SIGTERM
向其发送消息吗?
我见过这样的情况有尽管取消了,但仍被删除/移动到其他节点,甚至立即重新安排到同一节点......
对于它在做什么以及为什么这样做,有什么建议吗?
答案1
我希望你已经找到答案了,因为这是一个老问题。对于任何尚未找到答案的人,这个帖子可能会提供一些见解。它基本上说,如果您的 podtolerationSeconds
在其tolerations
部分中设置了,您将会遇到这种情况。删除此字段将“解决”此问题。
解释
可以观察到,使用 tolerationSeconds 参数会导致 Pod 同步重新创建。这是一个可选字段,用于指示添加污点后 Pod 将与节点保持绑定的时间。例如,如果将其设置为 6000 秒(1 小时 40 分钟),则 Pod 将与节点保持绑定 6000 秒,然后被驱逐。