我在 7 台相同类型的设备上使用 Ubuntu(特别是 Mate)18.04。它们都以类似的配置运行,并且当前正在连接的显示器上显示一些图像和视频。偶尔,随机设备会硬锁定,没有任何迹象表明出现任何问题。我尝试使用 netconsole 捕获日志,但没有看到任何表明锁定原因的信息。锁定之间的时间量不固定。
每台设备都使用 Intel i3 CPU 和 8GB RAM。CPU 闲置率为 80%。在阅读了其他人遇到的问题后,我应用了“intel_idle.max_cstate=1”,这起初似乎有帮助,但并没有解决问题。
原始安装使用内核 5.0.0,但我已将其更新为最新版本(通过 ubuntu 更新)5.3.0。我还将系统上的 BIOS 更新为最新版本。
作为比较,我安装了几个 Windows 只是为了看看它是否是硬件特有的,但它们运行起来没有问题。我已经研究这个问题几个月了,我进行的所有测试都没有找到根本原因。
还有什么我可以尝试的吗(内核命令行选项、内核版本、固件等)来看看是否可以找到一种方法来保持这些系统运行而不会出现硬锁定?
答案1
有趣的问题,准备充分。我假设您需要在锁定后“硬”重启。在这种情况下,您可以尝试阅读上一次启动通过发出日志/日志数据
journalctl -b -1
在终端中。我不确定这是否对您有帮助,但锁定表示 CPU 或 GPU 存在问题。我猜你使用的是英特尔驱动程序?
编辑。这不是一个干净的解决方案,但您可以尝试删除英特尔微代码 - 只是为了测试。
sudo apt-get purge intel-microcode
Redhat 有书面关于它,可能会有一些调整使你的 GPU 变得无用。由于英特尔微代码是一项安全功能,我会在测试后重新安装它……