在 nvidia 3090 上分析 CUDA:“此版本的 nvprof 不支持底层设备”

在 nvidia 3090 上分析 CUDA:“此版本的 nvprof 不支持底层设备”

我在装有 nvidia rtx 3090 显卡的 Ubuntu 20.04 LTS 系统上安装了 CUDA 工具包。并且我已成功编译并运行了不同的代码示例。但我无法运行官方分析器工具。nvprof这是我收到的完整错误消息:

======== Warning: This version of nvprof doesn't support the underlying device, GPU profiling skipped
======== Error: application not found.

结果如下nvprof --version

nvprof: NVIDIA (R) Cuda command line profiler
Copyright (c) 2012 - 2019 NVIDIA Corporation
Release version 10.1.243 (21)

如果相关的话,结果如下nvcc --versioin

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Sun_Jul_28_19:07:16_PDT_2019
Cuda compilation tools, release 10.1, V10.1.243

nvprof与 nvidia 最新的卡或 Ubuntu 20.04之间是否存在兼容性问题?

答案1

20.04附带旧的 nvprof 工具:nvidia-profiler (10.1.243-3)

20.10附带一个较新的版本:nvidia-profiler (11.0.3-1ubuntu1)

不幸的是,这些都无法在 3000 系列卡上运行。

即使你从此 NVIDIA 服务器为 deb 档案提供服务,但它将不支持它。

相反,您需要运行 nvidia-nsight-compute 来分析您的内核。似乎使用 nvprof 进行命令行分析已不再可行。

答案2

Bram 的答案似乎是正确的。如果您仍想留在控制台中,也许可以尝试以下方法:

nsys profile -t nvtx,cuda --stats=true --force-overwrite true --wait=all -o my_report ./my_app

nsys 为您提供了内核及其运行时的良好概述。

答案3

nvprof 不支持使用 Ampere 及更高架构的显卡。请参阅此关联

但是,您可以使用 Nsight Systems 兼容的语法来获得类似的输出:

nsys nvprof ./myapp

相关内容