几个月来,我一直遇到 Nvidia 驱动程序的这个问题。以下是我通常的做法:
我停止 gdm3 ( sudo service gdm3 stop
),使用 安装驱动程序sudo ./NVIDIA-Linux-x86_64-418.74.run --no-x-check
,然后按照说明操作,然后使用文件将 noveau 列入黑名单blacklist-nouveau.conf
- 它包含blacklist nouveau
,
options nouveau modeset=0
然后我安装 cuda、cudnn 等... 一切正常,包括nvidia-smi
,我可以在 gpu 上运行代码(tensorflow 中的某些 NN 模型)。几次重启后,我的驱动程序崩溃了。我启动到设置为 800x600 分辨率的登录屏幕,没有选项可以更改它。nvidia-smi
报告它无法连接到驱动程序。然后我重新安装驱动程序,然后它可以工作一段时间,但几次重启后它再次崩溃。
有几次我完全重新安装了所有东西,包括 Cuda 等,但行为没有变化。知道哪里出了问题吗?