1080Ti 与 V100 在同一个系统中,未检测到 V100

1080Ti 与 V100 在同一个系统中,未检测到 V100

我有一台 Ubuntu Server 16.04 系统,其中安装了 Geforce 1080Ti 和 Tesla V100。

我已将驱动程序更新至 396.37

当两者都存在时,lspci 可以看到两者,但是 nvidia-smi 只能看到 1080Ti 如果我移除 1080Ti,那么 nvidia-smi 现在就可以检测到 V100。

如果我放入 2 个 1080Ti,两者都可以工作并被 nvidia-smi 检测到。

我找不到任何地方说 Geforce 和 Tesla 不能一起工作。这是事实吗?如果不是,有人知道吗?

谢谢

答案1

我在日志中发现:

Jul 11 17:09:41 gpu-006 kernel: [    7.902609] NVRM: This PCI I/O region assigned to your NVIDIA device is invalid:
Jul 11 17:09:41 gpu-006 kernel: [    7.902609] NVRM: BAR1 is 0M @ 0x0 (PCI:0000:1a:00.0)
Jul 11 17:09:41 gpu-006 kernel: [    7.902611] NVRM: The system BIOS may have misconfigured your GPU.
Jul 11 17:09:41 gpu-006 kernel: [    7.902616] nvidia: probe of 0000:1a:00.0 failed with error -1

所以我更新了服务器的 BIOS。现在一切都解决了,两者都可以检测到。

相关内容