GCP VM:nvidia-container-cli:初始化错误:驱动程序错误:超时:未知

GCP VM:nvidia-container-cli:初始化错误:驱动程序错误:超时:未知

最近,当我尝试运行容器时,我的多个 GPU 的 GCP VM 抛出了以下错误:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:370: starting container process caused: process_linux.go:459: container ini
t caused: Running hook #1:: error running hook: exit status 1, stdout: , stderr: nvidia-container-cli: initialization error: driver error: timed out: unknown

我还注意到,执行nvidia-smi大部分时间需要 30 多秒。

眼镜:

  • 基础镜像:nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04
  • nvidia 驱动程序:450.102.04
  • 区域:europe-west1-b

我已经使用这个设置好几个月了,从未发现任何类似的东西。

相关内容