NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信——5.16.2 的内核头文件

NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信——5.16.2 的内核头文件

我正在尝试使用 Ubuntu 20.04.3 LTS 机器设置我的 Lenovo Legion 5 Pro,以便我可以使用我的 GPU(Nvidia Geforce RTX 3070 8GB)进行机器学习,例如使用 PyTorch。但是,即使多次重新安装 NVidia 驱动程序后,它似乎仍然不可见,因为运行 nvidia-smi 会出现以下情况:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA 
driver. Make sure that the latest NVIDIA driver is installed and running.

我已经研究过几种解决方案(),到现在为止什么都没起作用。但我认为问题是由我使用的内核引起的。

跑步nvcc --版本输出结果如下:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Sun_Jul_28_19:07:16_PDT_2019
Cuda compilation tools, release 10.1, V10.1.243

ls /usr/src | grep nvidia输出nvidia-470.86

当我尝试从运行这些命令时这里, IE

sudo apt install dkms
sudo dkms install -m nvidia -v 470.86

我收到以下错误:

Error! Your kernel headers for kernel 5.16.2-051602-generic cannot be found.
Please install the linux-headers-5.16.2-051602-generic package,
or use the --kernelsourcedir option to tell DKMS where it's located

现在linux-headers-5.16.2-051602-generic不存在,但是我已经linux-headers-generic安装了。

对于如何修复这个问题,您有什么建议吗?非常感谢!

答案1

您必须删除主线内核并使用以下命令安装普通 HWE

sudo apt-get autopurge $(dpkg -l | grep 5.16.2-051602 | awk '{print $2}')

sudo apt-get install linux-image-generic-hwe-20.04 linux-headers-generic-hwe-20.04

然后重新启动并使用软件和更新 ( software-properties-gtk) 安装 470 驱动程序。

相关内容