今天,我们的生产系统发生了严重故障。在没有任何用户交互的情况下,大多数 kubernetes pod 都出现故障,并显示“ImagePullBackOff”错误消息。
我们不得不手动重启构建并重新推送所有镜像。我验证了容器注册表中引用的镜像是否存在 - 确实如此,没有进行任何更改。即使镜像显示为可用,我们也必须重新推送它们以消除错误。
那里发生了什么?!
编辑
Docker 无法找到该图像。
$ docker pull eu.gcr.io/seepex-cs/scs-grafana
Using default tag: latest
latest: Pulling from seepex-cs/scs-grafana
9d48c3bd43c5: Already exists
4842084dac50: Already exists
7cbaa73b9ead: Already exists
9a7207a7a1b5: Already exists
6bb6df97bf66: Already exists
e9c24addd21e: Already exists
21ae065ef1d6: Already exists
error pulling image configuration: unknown blob
图像在谷歌容器注册表中列出:
答案1
我想到了。
因为我想节省空间和金钱,所以我为 eu.artifacts 设置了清理工作。项目.appspot.com 存储桶与其他存储桶一起。这是存储注册表工件的存储桶。30 天后,一些不太活跃的服务会被自动删除...