我的电脑最近自行重启,然后未决通知我可能存在与硬件相关的错误。检查 dmesg 后,我发现 mce 中有以下几行:
[ 0.554142] mce: [Hardware Error]: Machine check events logged
[ 0.554143] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 3: baa0000000040118
[ 0.554145] mce: [Hardware Error]: TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000
[ 0.554148] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013
我该如何解释这一点?我注意到它报告了微代码版本、我的 CPU 在哪个插槽中(0,因为我只有一个),等等,但这是否意味着 CPU 有问题?我希望得到一些关于情况的说明。
答案1
这麦克洛格程序可以提供一些解释:
/usr/sbin/mcelog --ascii < error_text
我提取了错误文本部分:
Machine check events logged
CPU 0: Machine Check: 0 Bank 3: baa0000000040118
TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000
PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013
然后我在 Linux Mint VM 上运行它,它给了我一个非常不完整的分析,其中重要的部分是:
Hardware event. This is not a software error.
通过在发生错误的计算机上运行分析,您可以获得更多详细信息。
根据您的信息,我个人的看法是,这是内存组 3 地址上的 RAM 问题baa0000000040118
。