Ubuntu RuntimeError 上的 PyTorch:CUDA 错误:所有支持 CUDA 的设备都繁忙或不可用

Ubuntu RuntimeError 上的 PyTorch:CUDA 错误:所有支持 CUDA 的设备都繁忙或不可用

我尝试按照建议从源代码构建 PyTorch。

规格:GPU:GT 710、驱动程序 460.32.03、CUDA 11.2、Python 3.8.5。

测试:

import torch 
print(torch.__version__)  -- 1.7.1
print(torch.cuda.is_available())   -- True
print(torch.backends.cudnn.enabled)    -- True
device = torch.device('cuda')
print(torch.cuda.get_device_properties(device))  -- _CudaDeviceProperties(name='GeForce GT 710', major=3, minor=5, total_memory=1998MB, multi_processor_count=1)
print(torch.tensor([1.0, 2.0]).cuda()) --RuntimeError: CUDA error: all CUDA-capable devices are busy or unavailable

答案1

我认为您的问题与您的卡安装的 cuda cc 版本有关。据我所知,您应该从源代码编译并确保 cuda cc 与 pytorch 版本兼容。请参阅https://github.com/pytorch/pytorch/issues/31285

答案2

看起来不错:

•   CUDA 11.2, uses Linux Driver >=460.27.03, You have 460.32.03
•   Major + Minor Values = 3.5, need at least 3 computational power to use Cuda 11.2
•   Python Version is 3.8.5 recommended is => 3.6
    You used "built from source install"

我认为这在很大程度上不是兼容性驱动的问题(尽管据报道有些 GT 710 的计算能力低于 3,但这里并非如此)任何关于兼容性的思考都可以在这里找到“https://docs.nvidia.com/deploy/cuda-compatibility/index.html#source-compatibility”有一个查询命令可以仔细检查 GPU 上的 CUDA 验证:它应该位于您的 CUDA 安装文件夹中的 extras 部分中。

使用命令 nvidia-smi 查看哪些进程正在使用显卡并显示结果。此外,我建议运行上述设备查询并发布图片。

如果显卡上已经有进程,你可以用 nvidia-smi | grep 'python' | awk '{ print $3 }' | xargs -n1 kill -9Where来终止它们'Python'是该进程的名称

相关内容