Docker swarm,所有容器都重新启动

Docker swarm,所有容器都重新启动

我们在生产环境中运行 Docker 群集模式,有 4 个节点,其中 3 个共享管理器状态。我们注意到,每隔几天,其中一台主机上的所有容器都会重新启动。

我当时查看了系统日志并看到以下消息(针对该主机上安排的所有容器重复):

Jan 26 07:26:14 HOST0 dockerd[13104]: time="2019-01-26T07:26:14.954777646Z" level=warning msg="failed to deactivate service binding for container service_container.1.lhc0gejxgb8y340bg9o2wfcm2" error="No such container: service_container.1.lhc0gejxgb8y340bg9o2wfcm2" module=node/agent node.id=2g08blfds9z26ja2ou06pv2zl

这些之前有一些与群体成员资格相关的消息,但它们也毫无问题地发生,并且无论如何都在 level=info。

值得一提的是,在某些主机上我们有像数据库这样的单实例状态服务。

到目前为止,我需要了解是什么触发了服务的重新创建以及如何避免这种情况。首先,我应该从日志中查找什么特殊内容吗?

提前谢谢您!

答案1

我建议从重新启动的服务的任务开始。它应该给出退出的原因,以及容器的 PID 1 进程的退出代码。

docker service ps $SERVICE_NAME将列出最后 5 个服务任务(或您设置的历史记录限制)。

获取已退出任务的 ID 并用来docker inspect $TASK_ID获取详细信息。

相关内容