我有一个运行 Ubuntu 18.04 的系统,它随机冻结。在启动日志条目中,如
mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 4: e600000000020408
出现。在较旧的 Ubuntu 版本中,mcelog
可用于解码这些条目。mcelog
现已被删除。如何解码日志条目以找出 Ubuntu 18.04 中的故障来自哪里?
答案1
mcelog
仍然可以手动编译和执行。如果你安装了 git 和构建工具链,你可以运行:
git clone git://git.kernel.org/pub/scm/utils/cpu/mce/mcelog.git
cd mcelog
make
./mcelog --ascii < /path/to/logfile
日志文件应包含类似以下内容的内容:
CPU 0: Machine Check: 0 Bank 4: e600000000020408
TSC 0 ADDR fef13b80
PROCESSOR 0:506c9 TIME 1565455642 SOCKET 0 APIC 0 microcode 38
mcelog
将会把解码的信息打印到标准输出。
答案2
“日志文件应包含类似以下内容的内容:CPU 0:机器检查:0 Bank 4”
在这种情况下,你不需要 mclog