我运行 Kubuntu 作为我的桌面开发系统。我遇到过 3 次这个问题,最后一次我没能解决它。我突然注意到 CUDA 没有响应。我重新启动了计算机,系统的分辨率在某种兼容模式下出现故障。不知道该怎么做,我运行了 Discover 中的所有更新。我重新启动了系统,一切正常。过去两次发生这种情况时,这种方法有效,但最后一次,系统卡住了,无法安装更新队列中名为 nvidia-kernel-common-535 的软件包。错误消息是
dpkg: error processing archive /var/cache/apt/archives/nvidia-kernel-common-535_535.161.07-0ubuntu1_amd64.deb (--unpack):
trying to overwrite '/lib/firmware/nvidia/535.161.07/gsp_ga10x.bin', which is also in package nvidia-firmware-535-535.161.07 535.161.07-0ubuntu0.22.04.1
这看起来像是 nvidia 和 nvidia 535 版本之间的冲突。我曾尝试自己移动文件,但包管理器似乎太智能了。
我曾考虑过删除所有 nvidia 内容,然后重新安装,但我担心替代的开源驱动程序可能会被列入黑名单,并且我的系统可能根本无法启动。
我应该怎么办?
答案1
我不小心升级了显卡驱动程序,遇到了同样的问题。我尝试使用以下命令。
sudo dpkg --force-all -i /var/cache/apt/archives/nvidia-kernel-common-535_535.161.07-0ubuntu1_amd64.deb
sudo apt --fix-broken install
到目前为止看起来不错。
$ nvidia-smi
Sat Mar 2 13:16:25 2024
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.161.07 Driver Version: 535.161.07 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce GTX 1070 Ti On | 00000000:01:00.0 On | N/A |
| 34% 44C P8 11W / 180W | 470MiB / 8192MiB | 35% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
| 1 NVIDIA GeForce GTX 1070 Ti On | 00000000:03:00.0 Off | N/A |
| 33% 31C P8 5W / 180W | 6MiB / 8192MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+