最近,当我尝试运行容器时,我的多个 GPU 的 GCP VM 抛出了以下错误:
docker: Error response from daemon: OCI runtime create failed: container_linux.go:370: starting container process caused: process_linux.go:459: container ini
t caused: Running hook #1:: error running hook: exit status 1, stdout: , stderr: nvidia-container-cli: initialization error: driver error: timed out: unknown
我还注意到,执行nvidia-smi
大部分时间需要 30 多秒。
眼镜:
- 基础镜像:
nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04
- nvidia 驱动程序:450.102.04
- 区域:europe-west1-b
我已经使用这个设置好几个月了,从未发现任何类似的东西。