在 LXC 容器中执行 Cuda 脚本导致“cuda 错误：未检测到支持 CUDA 的设备”

Question

这个问题似乎已经在 SuperUser 上询问过，但如果它在 ServerFault 中已经存在，我只能将其标记为重复。我将我的答案复制到这里，希望它能帮助那些首先遇到这个问题的人。

我也遇到过同样的问题，我对此写过一篇长文这里。

您遇到的问题可能是由于使用了与您的主机不匹配的 LXC 模板造成的。我使用的是基于 Debian 8.6 的 Proxmox 4.4。我的容器基于 Ubuntu 16.04。就像您一样，我在容器中看到了传递的节点根作为所有者和群组，不没人：无群组正如预期的那样。

A我偶然发现的论坛帖子启发我基于与我的主机 Debian 8.6 匹配的模板构建了一个新容器。一旦我这样做，节点/dev就归我的 GPU 所有nobody:nogroup，并nvidia-smi正确识别了我的 GPU。

如果您的不匹配，我强烈建议您尝试使它们匹配 - 我知道的唯一方法就是重建它。

Answer 1

这个问题似乎已经在 SuperUser 上询问过，但如果它在 ServerFault 中已经存在，我只能将其标记为重复。我将我的答案复制到这里，希望它能帮助那些首先遇到这个问题的人。

我也遇到过同样的问题，我对此写过一篇长文这里。

您遇到的问题可能是由于使用了与您的主机不匹配的 LXC 模板造成的。我使用的是基于 Debian 8.6 的 Proxmox 4.4。我的容器基于 Ubuntu 16.04。就像您一样，我在容器中看到了传递的节点根作为所有者和群组，不没人：无群组正如预期的那样。

A我偶然发现的论坛帖子启发我基于与我的主机 Debian 8.6 匹配的模板构建了一个新容器。一旦我这样做，节点/dev就归我的 GPU 所有nobody:nogroup，并nvidia-smi正确识别了我的 GPU。

如果您的不匹配，我强烈建议您尝试使它们匹配 - 我知道的唯一方法就是重建它。

相关内容