简而言之,我想在命令行上查找 Ubuntu 20.04 上 NVIDIA 显卡的 CUDA 计算能力以及 CUDA 核心的数量和类型。
有什么建议吗?我尝试过nvidia-smi -q
并查看过nvidia-settings
- 但没有成功/没有详细信息。我还忘了说我尝试通过 查找详细信息/proc/driver/nvidia
。
答案1
如果您已nvidia-settings
安装实用程序,则可以通过运行来查询 GPU 的 CUDA 核心数量nvidia-settings -q CUDACores -t
。如果这不起作用,请尝试nvidia-settings -q :0/CUDACores
。
- :0是 gpu 插槽/ID:在这种情况下,0 指的是第一个 GPU。
- CUDA核心是财产
如果您已安装cuda
& nvidia-cuda-toolkit
,请尝试运行deviceQuery
。它应该位于/usr/local/cuda-11/extras/demo_suite/deviceQuery
尝试运行定位设备查询的某个位置。
答案2
有/proc/driver/nvidia
一些看起来很有希望:
sh@balrog:~$ tree /proc/driver/nvidia
/proc/driver/nvidia
├── capabilities
│ ├── gpu0
│ │ └── mig
│ └── mig
│ ├── config
│ └── monitor
├── gpus
│ └── 0000:01:00.0
│ ├── information
│ ├── power
│ └── registry
├── params
├── patches
│ └── README
├── registry
├── suspend
├── suspend_depth
├── version
└── warnings
└── README
...但我找不到那里的 GPU 数量。
sh@balrog:~$ cat /proc/driver/nvidia/gpus/*/information
Model: NVIDIA GeForce GTX 1050 Ti
IRQ: 34
GPU UUID: GPU-4087ca95-8a80-05fd-85f9-f50a4849fe4e
Video BIOS: 86.07.42.00.77
Bus Type: PCIe
DMA Size: 47 bits
DMA Mask: 0x7fffffffffff
Bus Location: 0000:01:00.0
Device Minor: 0
GPU Excluded: No
在一些相关文章中,人们指出了nvcc
哪个是软件包的一部分nvidia-cuda-toolkit
。你可以尝试一下。
也可以看看 http://manpages.ubuntu.com/manpages/bionic/man1/cuda-binaries.1.html
答案3
只是为了稍微扩展一下 Jiahui Chen 的回答...使用这些查询行创建一个脚本来获取核心数、计算能力和 CUDA 版本,这可能会有所帮助,例如,在安装 torch 或 tensorflow 时。
echo " "
nvidia-smi --query-gpu=name --format=csv
echo "Number of CUDA Cores: $(nvidia-settings -q CUDACores -t)"
nvidia-smi --query-gpu=driver_version --format=csv
nvidia-smi --query-gpu=compute_cap --format=csv
nvidia-smi -q |grep CUDA
echo " "
更改脚本的属性使其可执行并使用 sudo 或以 root 身份运行