NVidia 驱动程序经常在我的 Ubuntu 16.04 上崩溃

NVidia 驱动程序经常在我的 Ubuntu 16.04 上崩溃

我在两台电脑上安装了两块 NVidia GPU:一块 GTX1080 和一块 GTX1050。两台电脑的操作系统都是 Ubuntu 16.04LTS,上个月都更新了官方网站上的最新驱动程序。我经常观察到我认为是驱动程序崩溃的情况:我卡在 GUI 中的登录循环中(登录屏幕-> 输入密码并按 Enter -> 黑屏-> 再次登录屏幕),python-lasagne GPU 后端无法启动。通过重新安装驱动程序,一切都立即恢复正常。

GTX1080 机器是我每天工作的机器,它的驱动程序经常崩溃:每当我在 PC 断电时拔下/插入双显示器之一时,我肯定会遇到崩溃。今天我更换了其中一台显示器,这种情况又发生了。

GTX1050 机器用作服务器,当我们意外断电时,驱动程序问题就出现了(并通过同样的方式修复)。

我的问题是:这是正常的吗?我能以某种方式避免这种情况吗?或者至少比重新安装整个标准+cuda 驱动程序更快地修复它(虽然不是那么慢,但很烦人)?两台机器都安装了 Win10,显卡从来没有出现过问题,所以我想这是一个 Ubuntu 错误。

答案1

如果您无需重新安装操作系统即可解决登录循环问题,请发布您的解决方案。我们在为 theano - lasagne 准备 Ubuntu 16.04.2 时也遇到了这个问题。对我们有用的组合是:1. 在“附加驱动程序”中切换到 Nvidia 驱动程序(很明显但必须说明)2. 按照 Theano 的 Ubuntu 安装说明进行操作。我们安装了 Anaconda 而不是建议的 miniconda。在那里安装依赖项。请注意,Theano 本身应按照 Lasagne 指南进行安装 3. 遵循 lasagne 安装指南,包括安装最新的 theano 包而不是 Ubuntu 的默认包。

答案2

我有两台电脑,一台装有 nvidia 旧版 9600 GT,另一台装有 nvidia GT 440 显卡。老版本使用 Nvidia 340 非免费驱动程序(不能调高,否则会崩溃),新电脑使用 Nvidia 384 非免费驱动程序。但有时 gnome3 桌面会崩溃。5 次中有 3 次桌面会恢复,并向 ubuntu 发送错误报告。2 次需要重启。从那次重启(使用电脑重置)开始,2 次中有 1 次无法重启电脑。(使用 gdm3)没有出现登录屏幕,但出现了 lightgdm 登录,但分辨率较低。如果您尝试登录,则会发生新的崩溃。唯一的解决办法是在启动菜单中使用 ubuntu upstart,但它只会启动没有图形支持的 ubuntu。然后使用 apt-get remove purge nvidia*,接着使用 apt-get install nvidia-340(对于旧电脑,因为这是使用的驱动程序版本)和 nvidia-384(对于现代电脑)。之后一切又运行正常。这个问题出现在开始使用 gnome3 的那天(但使用 unity 时是同样的问题)。不知为何,我怀疑在某些情况下会发生段错误,不幸的是我一直找不到发生的原因和方式。它完全失控,这是段错误的典型特征。我认为这与显卡本身无关,但看起来是 nvidia 驱动程序和 gnome3 在某些情况下共同存在的问题。最糟糕的是需要卸载(并清除!)nvidia 驱动程序,看起来在崩溃时其中一个设置有时会被搞砸。这很奇怪,但确实发生在两台不同的电脑上。一个较旧的:Intel® Core™2 Duo CPU E8600 @ 3.33GHz × 2 ,GeForce 9600 GT/PCIe/SSE2(Gigabyte P-45 extreme MB),4 GB RAM。 一个较新的 Intel core i7 cpu x 990 3.47Ghz x 12 ,Geforce GT 440/PCIe/SSE2(asus P6 X58 Ws MB),12 GB RAM。

两者都采用 ubuntu 16.04 Lts Gnome3 桌面。

相关内容