我该如何解释 mce 的输出?

我该如何解释 mce 的输出?

我的电脑最近自行重启,然后未决通知我可能存在与硬件相关的错误。检查 dmesg 后,我发现 mce 中有以下几行:

[    0.554142] mce: [Hardware Error]: Machine check events logged
[    0.554143] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 3: baa0000000040118
[    0.554145] mce: [Hardware Error]: TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000 
[    0.554148] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013

我该如何解释这一点?我注意到它报告了微代码版本、我的 CPU 在哪个插槽中(0,因为我只有一个),等等,但这是否意味着 CPU 有问题?我希望得到一些关于情况的说明。

答案1

麦克洛格程序可以提供一些解释:

/usr/sbin/mcelog --ascii < error_text

我提取了错误文本部分:

Machine check events logged
CPU 0: Machine Check: 0 Bank 3: baa0000000040118
TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000 
PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013

然后我在 Linux Mint VM 上运行它,它给了我一个非常不完整的分析,其中重要的部分是:

Hardware event. This is not a software error.

通过在发生错误的计算机上运行分析,您可以获得更多详细信息。

根据您的信息,我个人的看法是,这是内存组 3 地址上的 RAM 问题baa0000000040118

相关内容