Ubuntu 18.04 和 RTX 2080 SUPER 系统冻结

Ubuntu 18.04 和 RTX 2080 SUPER 系统冻结

我正在尝试解决一个棘手的问题:我的 Ubuntu 18.04.4 LTS 在使用我的显卡(RTX 2080 SUPER)时会随机冻结。内核日志没有显示任何有用的信息(syslog、kern 和 xorg附于此处)。

发生冻结时,我无法使用鼠标或键盘。按键盘上的任意键也会使数字锁定键关闭,这使得无法使用 ALT + SysRQ 方法安全地重新启动系统。断开/重新连接 USB 电缆并不能解决问题。

我注意到这个冻结问题发生在两种情况下:(i)使用 TensorFlow 1.14 和 CUDA 训练深度学习模型时,以及(ii)玩 DoTA2 时(虽然这种 DoTA2 冻结现象相当新,但它并不是每次都会发生)。

我已经尝试了以下“可能的解决方案”,但无济于事:

  1. 将我的风扇设置为全速/性能模式,认为这可能是过热问题(虽然不太可能,因为我的电脑是新的);
  2. 将 nouveau 驱动程序放入 /etc/modprobe.d/blacklist.conf;
  3. 更改 BIOS 设置中的“暂停至内存禁用”;
  4. 从 gdm 切换到 lightdm(按照这个帖子(英文):
  5. 从 nvidia-driver-440 切换到 nvidia-driver-435(均为专有驱动程序);
  6. 格式化我的电脑并重新安装 Ubuntu 18.04.4 LTS。

我不知道它是否有用,但我也有 Windows 10 和 Ubuntu 18.04.4 LTS 双启动。我昨天格式化了我的计算机,以为这样可以解决我的问题,所以我愿意做任何事情。

任何帮助,将不胜感激。


硬件和其他设置:

  • 因此:Ubuntu 18.04.4 LTS(双启动:Windows 10)
  • 内核:Linux 5.3.0-53-generic
  • 处理器:英特尔酷睿 i9-9900KF 3.60GHz(5.0GHz Turbo)
  • 显卡:华硕 Rog Strix GeForce RTX 2080 SUPER/PCIe/SSE2 8GB GDDR6 256Bit
  • GL版本:4.5.0 NVIDIA 440.59
  • 主板:华擎 Z390 Extreme 4 芯片组 Z390 Intel LGA 1151 ATX DDR4
  • 内存:DDR4 Corsair Vengeance RGB Pro (4x8GB) 3600MHz
  • 水冷器:Corsair H115i Pro RGB 280mm
  • 电源:XFX 650W XTR 系列 ATX/EPS 全模块化 80PLUS GOLD,P1-650B-BEFX
  • 存储:SSD Corsair Force MP510 960GB M.2 2280 NVMe 和 HD Seagate Barracuda 1TB(仅用作额外存储空间,安装在 /mnt/data 上)

相关内容