在 puppet 配置中犯了一个错误,无意中让 puppet 将 kubernetes 集群升级到 1.13.0。由于 k8 需要一个稍微复杂的升级过程,所以整个事情相当糟糕。
在手动运行该过程并将所有受影响的节点和主节点升级到同一版本后,似乎库贝莱特(以及 api 服务器)将运行 20-30 分钟,然后停止响应。
当它开始变得不高兴时,日志开始看到更多类似这样的条目:
level=error msg="在容器中运行 exec 时出错:rpc 错误:代码 = 2 desc = oci 运行时错误:exec 失败:container_linux.go:247:启动容器进程导致 \"process_linux.go:110:从管道解码初始化错误导致 \\"读取父级:对等方重置连接\\"\"\n"
和
file.go:182] 未递归到清单路径“/etc/kubernetes/manifests/<path>”
具有各种命名空间条目小路。此循环每 20 秒重复一次,直到 kubelet 最终停止响应。如果我手动重启 kubelet,它会工作一段时间,然后重新开始循环。
我在升级过程中是否遗漏了什么?
编辑:
[root@kube-master ~]# rpm -qa | grep docker
docker-client-1.13.1-84.git07f3374.el7.centos.x86_64
docker-1.13.1-84.git07f3374.el7.centos.x86_64
docker-common-1.13.1-84.git07f3374.el7.centos.x86_64
答案1
第一个错误消息看起来很有可能这个。
也许您可以检查那些受影响的节点是否正在运行最新版本的 docker?