无法让 CUDA 在 conda 环境 Ubuntu 22.04 上运行

无法让 CUDA 在 conda 环境 Ubuntu 22.04 上运行

我正在尝试安装 Cuda 11.3(因为我知道这是最稳定的版本,之后的任何版本都会导致兼容性问题)。我有 Ubuntu 22.04 LTS,并遵循以下说明:https://developer.nvidia.com/cuda-11-3-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

当我输入所有命令时,我执行 nvidia-smi 并得到以下结果:

| NVIDIA-SMI 520.61.05    Driver Version: 520.61.05    CUDA Version: 11.8     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0 Off |                  N/A |
|  0%   37C    P8     8W / 220W |     99MiB /  8192MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1245      G   /usr/lib/xorg/Xorg                 86MiB |
|    0   N/A  N/A      1498      G   /usr/bin/gnome-shell               10MiB |
+-----------------------------------------------------------------------------+

但是当我nvcc --version 这样做时,它返回“未找到命令‘nvcc’,但可以使用以下命令安装:sudo apt install nvidia-cuda-toolkit。如果我运行 nvidia-cuda-toolkit 的安装命令,nvidia-smi 命令将停止工作,当我测试 cuda 是否与 pytorch 一起使用时,我一直得到torch.cuda.is_available()False。

我执行了 sudo ubuntu-drivers autoinstall 来安装驱动程序,但没有任何变化。奇怪的是,在我的基础 conda 环境中,torch.cuda.is_available()返回 true。如果有人能帮忙,我将不胜感激。

谢谢!

答案1

更新到 Ubuntu 22.04 后,我遇到了同样的问题。按照以下说明https://pytorch.org/尽管我的 nvidia-smi 给出的 Cuda 版本是 11.7,但我还是选择了 cuda 11.6

+----------------------------------------------------------------------------+ | NVIDIA-SMI 515.76 驱动程序版本:515.76 CUDA 版本:11.7 | |------------------------------------------+----------------------+--------------------

注意:cudatoolkit 11.6 需要“conda-forge”频道

conda 安装 pytorch torchvision torchaudio cudatoolkit=11.6 -c pytorch -c conda-forge

我的 conda 环境的 python 版本是 Python 3.10.6

操作系统级别的 cuda 驱动程序版本似乎不会对 pytorch 附带的 cudatoolkit 产生影响

相关内容