我们的临时环境中有一个 k3s 集群,其中包含一个主节点和两个代理节点。最近,我注意到主节点正在使用大量资源。我也无法从我们的终端通过 SSH 连接到服务器。我不得不使用我们的 IAAS 来访问它,并发现有人已将主节点设置为可调度。我耗尽了主节点并重新启动了它,但仍然无法通过 SSH 连接到该节点。此外,代理节点无法连接到主节点。
我禁用了 k3s 服务,一切正常。但是,启动 k3s 后,几秒钟后我再次无法 SSH 或 ping 节点。旧连接工作正常,但新连接失败。例如,如果我在启动 k3s 之前有一个 SSH 会话,则启动后它继续工作。我可以 ping 节点上的 localhost,但无法 ping 我们为其使用的 IP。该节点有一个私有 IP 地址。
我排除了资源问题,因为节点在排空后的 CPU 使用率约为 1%。我在其系统文件中设置了 CPUQuota 以确保万无一失,但没有任何变化。
k3s版本为v1.26.5+k3s1,k3s服务启动命令如下(省略节点名和IP):
/usr/local/bin/k3s \
server \
'--node-external-ip' \
'IP' \
'--node-name' \
'NODE_NAME' \
'--disable=traefik' \
'--node-ip' \
'IP' \
'--flannel-backend=host-gw' \
'--kube-proxy-arg=proxy-mode=ipvs' \
root@localhost:/home/devbale# iptables -L
Chain INPUT (policy ACCEPT)
target prot opt source destination
Chain FORWARD (policy ACCEPT)
target prot opt source destination
Chain OUTPUT (policy ACCEPT)
target prot opt source destination
我还检查了ip a
接口 IP 是否发生变化,但它仍然存在。当我在 k3s 启动后 ping IP 时,我得到了Destination Port Unreachable
。代理节点connection reset by peer
在尝试连接到主节点时会得到 。
节点上没有防火墙,UFW 被禁用并且iptables -l
没有返回规则。
我找不到任何有用的 k3s 日志。如果您需要了解其他信息,请告诉我。我搜索了此问题的解决方案,但尚未找到任何解决方案。感谢您的帮助。
我找不到任何有关 k3s 的有用日志,但如果您需要了解任何信息,请告诉我。
我已经搜索了这个问题的解决方案,但没有找到任何结果。感谢您的帮助。