我的系统实际上有多少个 nVIDIA GPU?

我的系统实际上有多少个 nVIDIA GPU?

这很愚蠢,但就我的情况而言,我实际上并不知道我的服务器上 nVIDIA Grid K2 GPU 的数量(我无法亲自去验证)。

nvidia-smi 的输出是:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.64                 Driver Version: 367.64                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GRID K2             On   | 0000:86:00.0     Off |                  Off |
| N/A   41C    P8    29W / 117W |     10MiB /  4095MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GRID K2             On   | 0000:87:00.0     Off |                  Off |
| N/A   33C    P8    28W / 117W |      8MiB /  4095MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   2  GRID K2             On   | 0000:8B:00.0     Off |                  Off |
| N/A   34C    P8    28W / 117W |      8MiB /  4095MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

nvidia-smi -L 给出:

GPU 0: GRID K2 (UUID: GPU-f38f91db-d219-6dae-3f2c-ccce0dee93b5)
GPU 1: GRID K2 (UUID: GPU-a165f882-655e-31c0-b6f0-46748129ff17)
GPU 2: GRID K2 (UUID: GPU-44daaa30-3e5b-558c-2775-1e9802be7e91)

主机是一台 20 核、2 插槽的 Intel 机器。

现在,我无法弄清楚为什么它显示 3 个 GPU,因为 1 Grid K2 实际上有 2 个 GPU,所以 nvidia-smi 实际上应该显示偶数个 Grid K2 GPU(在我的情况下是 2 个或 4 个)。

答案1

根据您的统计数据,看起来像是 3,但您可以进行更详细的检查。

如果您的系统正在运行 Windows Server,请从 cmd 提示符中使用:

wmic path win32_VideoController get AdapterRAM, Caption, DriverVersion

如果您使用 Linux:

lspci | grep -i --color 'vga\|3d\|2d'

或者

lshw -short | grep -i --color display

nvclock命令还应该显示 GPU 上的时钟信息。

这些将列出有关视频适配器的有用信息。

答案2

尝试nvidia-smi -L

(来自 Linux 系统上的 man nvidia-smi 输出:)

-L, --list-gpus
列出系统中的每个 NVIDIA GPU 及其 UUID。

编辑: 重新阅读原始问题,我发现 OP 已经尝试过此解决方案,但这不是他们想要的。哎呀。

相关内容