Intel Apollo Lake (J3455) 启动时 UI 随机频繁冻结且出现 MCE 错误

Intel Apollo Lake (J3455) 启动时 UI 随机频繁冻结且出现 MCE 错误

我遇到了问题华擎 J3455-ITX跑步Ubuntu 16.10

第一个值得注意的问题与系统中的随机冻结有关。它们在 Chrome 中打开多个标签时肯定更容易重现,但有时在简单地使用终端正在运行apt update(在 Unity 中)。冻结可能会导致整个系统无响应(在大多数情况下,键盘和鼠标仍然可以工作,但有时它们甚至会停止响应)。

在进一步调查此事时,我注意到dmesg

mce: [Hardware Error]: Machine check events logged

我已安装mcelog并现在可以看到以下内容/var/log/mcelog

mcelog: failed to prefill DIMM database from DMI data
mcelog: Family 6 Model 92 CPU: only decoding architectural errors
Hardware event. This is not a software error.
MCE 0
CPU 0 BANK 4
ADDR fef13b80
TIME 1484930342 Fri Jan 20 17:39:02 2017
MCG status:
MCi status:
Uncorrected error
MCi_ADDR register valid
Processor context corrupt
MCA: Internal unclassified error: 408
Running trigger `unknown-error-trigger'
STATUS a600000000020408 MCGSTATUS 0
MCGCAP c07 APICID 0 SOCKETID 0
CPUID Vendor Intel Family 6 Model 92

有趣的是,像这样的错误正在发生在我身上仅在启动时(但每次启动时都会不断重复) - 但系统已经运行时没有任何迹象(即使我遇到提到的随机冻结)。

你们当中有人知道哪里出了问题吗?这个错误是否mcelog明确表明我遇到了某种硬件问题?或者这可能是内核、驱动程序、固件、微代码或其他任何东西混合导致的错误?

答案1

我和你的情况一样,使用的是运行 Ubuntu 16.10 的 ASRock J4205-ITX。mcelog 输出与你的相同,但我在系统运行时没有遇到死机,可能是因为我将它用作无头服务器。

但是,在连接显示器的情况下启动时,gpu 似乎会出现随机问题。Ubuntu 启动正常,系统可以通过 ssh 访问,但连接的显示器不显示任何内容(没有启动消息,也没有 shell 登录)。我尝试了 grub 参数,但仍然时好时坏。

这可能是内核相关或硬件错误。不幸的是,这是我能告诉你的全部。

答案2

尝试将您的 BIOS 更新至 1.20:

http://asrock.com/mb/Intel/J3455-ITX/?cat=Download&os=BIOS

原始 1.0 版 bios 非常不稳定。

相关内容