在 Ubuntu 18.04 中解码 MCE(机器检查异常)

在 Ubuntu 18.04 中解码 MCE(机器检查异常)

我有一个运行 Ubuntu 18.04 的系统,它随机冻结。在启动日志条目中,如

mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 4: e600000000020408

出现。在较旧的 Ubuntu 版本中,mcelog可用于解码这些条目。mcelog现已被删除。如何解码日志条目以找出 Ubuntu 18.04 中的故障来自哪里?

答案1

mcelog仍然可以手动编译和执行。如果你安装了 git 和构建工具链,你可以运行:

git clone git://git.kernel.org/pub/scm/utils/cpu/mce/mcelog.git
cd mcelog
make
./mcelog --ascii < /path/to/logfile

日志文件应包含类似以下内容的内容:

CPU 0: Machine Check: 0 Bank 4: e600000000020408
TSC 0 ADDR fef13b80 
PROCESSOR 0:506c9 TIME 1565455642 SOCKET 0 APIC 0 microcode 38

mcelog将会把解码的信息打印到标准输出。

答案2

“日志文件应包含类似以下内容的内容:CPU 0:机器检查:0 Bank 4”

在这种情况下,你不需要 mclog

相关内容