如何在 NVIDIA GPU 的命令行上查找 CUDA 核心和信息

如何在 NVIDIA GPU 的命令行上查找 CUDA 核心和信息

简而言之,我想在命令行上查找 Ubuntu 20.04 上 NVIDIA 显卡的 CUDA 计算能力以及 CUDA 核心的数量和类型。

有什么建议吗?我尝试过nvidia-smi -q并查看过nvidia-settings- 但没有成功/没有详细信息。我还忘了说我尝试通过 查找详细信息/proc/driver/nvidia

答案1

如果您已nvidia-settings安装实用程序,则可以通过运行来查询 GPU 的 CUDA 核心数量nvidia-settings -q CUDACores -t。如果这不起作用,请尝试nvidia-settings -q :0/CUDACores

  • :0是 gpu 插槽/ID:在这种情况下,0 指的是第一个 GPU。
  • CUDA核心是财产

如果您已安装cuda& nvidia-cuda-toolkit,请尝试运行deviceQuery。它应该位于/usr/local/cuda-11/extras/demo_suite/deviceQuery 尝试运行定位设备查询的某个位置。

答案2

/proc/driver/nvidia一些看起来很有希望:

sh@balrog:~$ tree /proc/driver/nvidia
/proc/driver/nvidia
├── capabilities
│   ├── gpu0
│   │   └── mig
│   └── mig
│       ├── config
│       └── monitor
├── gpus
│   └── 0000:01:00.0
│       ├── information
│       ├── power
│       └── registry
├── params
├── patches
│   └── README
├── registry
├── suspend
├── suspend_depth
├── version
└── warnings
    └── README

...但我找不到那里的 GPU 数量。

sh@balrog:~$ cat /proc/driver/nvidia/gpus/*/information
Model:       NVIDIA GeForce GTX 1050 Ti
IRQ:         34
GPU UUID:    GPU-4087ca95-8a80-05fd-85f9-f50a4849fe4e
Video BIOS:      86.07.42.00.77
Bus Type:    PCIe
DMA Size:    47 bits
DMA Mask:    0x7fffffffffff
Bus Location:    0000:01:00.0
Device Minor:    0
GPU Excluded:    No

在一些相关文章中,人们指出了nvcc哪个是软件包的一部分nvidia-cuda-toolkit。你可以尝试一下。

也可以看看 http://manpages.ubuntu.com/manpages/bionic/man1/cuda-binaries.1.html

答案3

只是为了稍微扩展一下 Jiahui Chen 的回答...使用这些查询行创建一个脚本来获取核心数、计算能力和 CUDA 版本,这可能会有所帮助,例如,在安装 torch 或 tensorflow 时。

echo " "
nvidia-smi --query-gpu=name --format=csv
echo "Number of CUDA Cores: $(nvidia-settings -q CUDACores -t)"
nvidia-smi --query-gpu=driver_version --format=csv
nvidia-smi --query-gpu=compute_cap --format=csv
nvidia-smi -q |grep CUDA
echo " "

更改脚本的属性使其可执行并使用 sudo 或以 root 身份运行

相关内容