这很愚蠢,但就我的情况而言,我实际上并不知道我的服务器上 nVIDIA Grid K2 GPU 的数量(我无法亲自去验证)。
nvidia-smi 的输出是:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.64 Driver Version: 367.64 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GRID K2 On | 0000:86:00.0 Off | Off |
| N/A 41C P8 29W / 117W | 10MiB / 4095MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GRID K2 On | 0000:87:00.0 Off | Off |
| N/A 33C P8 28W / 117W | 8MiB / 4095MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 2 GRID K2 On | 0000:8B:00.0 Off | Off |
| N/A 34C P8 28W / 117W | 8MiB / 4095MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
nvidia-smi -L 给出:
GPU 0: GRID K2 (UUID: GPU-f38f91db-d219-6dae-3f2c-ccce0dee93b5)
GPU 1: GRID K2 (UUID: GPU-a165f882-655e-31c0-b6f0-46748129ff17)
GPU 2: GRID K2 (UUID: GPU-44daaa30-3e5b-558c-2775-1e9802be7e91)
主机是一台 20 核、2 插槽的 Intel 机器。
现在,我无法弄清楚为什么它显示 3 个 GPU,因为 1 Grid K2 实际上有 2 个 GPU,所以 nvidia-smi 实际上应该显示偶数个 Grid K2 GPU(在我的情况下是 2 个或 4 个)。
答案1
根据您的统计数据,看起来像是 3,但您可以进行更详细的检查。
如果您的系统正在运行 Windows Server,请从 cmd 提示符中使用:
wmic path win32_VideoController get AdapterRAM, Caption, DriverVersion
如果您使用 Linux:
lspci | grep -i --color 'vga\|3d\|2d'
或者
lshw -short | grep -i --color display
nvclock
命令还应该显示 GPU 上的时钟信息。
这些将列出有关视频适配器的有用信息。
答案2
尝试nvidia-smi -L
(来自 Linux 系统上的 man nvidia-smi 输出:)
-L, --list-gpus
列出系统中的每个 NVIDIA GPU 及其 UUID。
编辑: 重新阅读原始问题,我发现 OP 已经尝试过此解决方案,但这不是他们想要的。哎呀。