Ubuntu 无法在多 GPU 模式下运行 caffe 模型

Ubuntu 无法在多 GPU 模式下运行 caffe 模型

我有三个连接的 GTX 1080 Ti,我正在尝试使用多 GPU 选项训练模型。但是它不起作用。使用单 GPU,它训练得很好,但使用多 GPU 时,它会显示以下内容并且什么也不做:

I1210 13:24:25.852613  3033 net.cpp:1358] [1] Reserving 582912 bytes of shared learnable space
I1210 13:24:25.852761  3032 net.cpp:1358] [0] Reserving 582912 bytes of shared learnable space
I1210 13:24:25.852787  3034 net.cpp:1358] [2] Reserving 582912 bytes of shared learnable space

我已经等待了足够长的时间,然后我必须终止该进程。执行此命令后,它会使用 100% 的所有 gpu。我该怎么办?

答案1

在 AMD 系统中,尝试设置 Ubuntu 时,您需要绕过 GPU。如果您尝试使用此选择来训练模型,则会收到此错误。

sudo nano /etc/defaults/grub

GRUB_CMDLINE_LINUX="iomnu=soft"

sudo 更新 grub

相关内容