我有一台 Ubuntu Server 16.04 系统,其中安装了 Geforce 1080Ti 和 Tesla V100。
我已将驱动程序更新至 396.37
当两者都存在时,lspci 可以看到两者,但是 nvidia-smi 只能看到 1080Ti 如果我移除 1080Ti,那么 nvidia-smi 现在就可以检测到 V100。
如果我放入 2 个 1080Ti,两者都可以工作并被 nvidia-smi 检测到。
我找不到任何地方说 Geforce 和 Tesla 不能一起工作。这是事实吗?如果不是,有人知道吗?
谢谢
答案1
我在日志中发现:
Jul 11 17:09:41 gpu-006 kernel: [ 7.902609] NVRM: This PCI I/O region assigned to your NVIDIA device is invalid:
Jul 11 17:09:41 gpu-006 kernel: [ 7.902609] NVRM: BAR1 is 0M @ 0x0 (PCI:0000:1a:00.0)
Jul 11 17:09:41 gpu-006 kernel: [ 7.902611] NVRM: The system BIOS may have misconfigured your GPU.
Jul 11 17:09:41 gpu-006 kernel: [ 7.902616] nvidia: probe of 0000:1a:00.0 failed with error -1
所以我更新了服务器的 BIOS。现在一切都解决了,两者都可以检测到。