我在一些本地金属实例上使用 RKE。如果我关闭一个节点(例如,拔掉它),kubectl
它就不会再响应 API 请求。60 秒后超时。
我应该寻找什么?FWIW,列出的 IP.kube/config
不是当前已死的节点。
$ time kubectl get nodes
Error from server (Timeout): the server was unable to return a response in
the time allotted, but may still be processing the request (get nodes)
这意味着如果一个节点发生故障,kubernetes 集群就毫无用处,这不是什么好事。
我正在使用 Calico/Flannel/canal、nginx-ingress 和 metallb。