GPU 已掉线

GPU 已掉线

在我添加额外的 Nvidia 1080ti 并运行训练神经网络后,出现了这样的错误。

GPU 0000:0a:00.0: GPU has fallen off the bus.

重启后,我无法运行nvidia-smi命令和nvidia-bug-report.sh。它们都没有声明任何错误,但也没有执行任何操作。此外,我无法通过经典的 ctrl+C 终止此进程。torch.cuda.is_available()从 python 运行只会冻结进程:没有错误,没有输出。所以不是,在出现该错误后,我的视频卡都无法工作,所以我不知道该检查什么。

附言

lshw正确显示所有 3 个显示器

相关内容