从 cuda 10.1 和驱动程序 440 正确降级

从 cuda 10.1 和驱动程序 440 正确降级

这是我的第一个问题,所以如果我错过了什么,请告诉我。目前我对linux的了解还很薄弱。

我正在运行带有 1080ti GPU (x2) 的 ubuntu 18.04。这是一个 threadripper 2990wx 和 128gigs 兼容的内存(如果这有某种关系,我错了)。

在过去的几周里,我一直在尝试使用带有 nvidia 驱动程序 440 的 cuda 10.1。我反复遇到崩溃;我的 firefox/chrome 选项卡会崩溃,然后我的鼠标变得没有反应(点击不起作用,但看到光标移动),并且我的终端无法激活(会打开闪烁的光标,但没有 user@pc 并且命令不起作用)。我曾想过发布崩溃报告,但看到其他帖子也有类似的问题,我基本上得出结论,驱动程序 440 是罪魁祸首(显然这个问题从驱动程序 430 开始就一直存在)。

没有问题地回滚到对我的配置更稳定的驱动程序的正确方法是什么?此时我也可以回滚我的 cuda 版本。我觉得我一直在进行 Beta 测试,并且更喜欢稳定的版本,以便我可以回去工作。

非常感谢你的帮助。

答案1

1) 降级前,请确保您拥有最新 NVIDIA 驱动程序,版本 440.82,直接来自 NVIDIA,而不是来自 PPA。

2) 如果直接从 NVIDIA 升级到最新的稳定驱动程序没有帮助,请卸载

sudo sh NVIDIA-Linux-x86_64-440.82.run --uninstall 

3) 如果您安装了 nvidia-current 或 nvidia-current-updates,请使用以下命令卸载它们

sudo apt -y remove nvidia-current nvidia-current-updates

4) 重命名xorg.confxorg.conf.old然后重新启动,将改用 nouveau。

5)重启后,下载并安装390.132或者418.113因为你已经读到了 430 以后的不愉快的事情。

6) 在进行任何更改之前测试这些驱动程序的稳定性库达。同时运行大量应用程序,包括压力或手动使用其他应用程序时具有低至中等工作负载的同等水平。密切关注结果自由的-m 或其他等效工具,并增加压力工作负载,直到大部分交换被使用。

相关内容