Ubuntu 20.04.1 LTS 崩溃并显示与 mce 相关的错误消息

Ubuntu 20.04.1 LTS 崩溃并显示与 mce 相关的错误消息

如果我不设置 GRUB 中的 maxcpus=1,Manjaro、Kubuntu 20.10 和 Ubuntu 20.04.1 LTS 都会崩溃。替换quiet splashnomodeset更改 UEFI BIOS 设置以禁用所有 Intel CPU 功能不会改变任何事情。Windows
10 运行没有问题并且非常稳定。
可用的崩溃日志:

mce: [Hardware Error]: CPU 5: Machine Check Exception: 5 Bank 0: f600020000040150
mce: [Hardware Error]: RIP !INEXACT! 10:<fffffffffb9c7e8eb> {mwait_idle_with_hints.constprop.0+0x4b/0x90}
mce: [Hardware Error]: TSC 25d1e1e46d ADDR 7fabd0e68be3
mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1605392958 SOCKET 0 APIC 3 microcode dcd64.deb: mismatch OK4.deb
mce: [Hardware Error]: Run the above through 'mcelog --ascii'
mce: [Hardware Error]: CPU 1: Machine Check Exception: 5 Bank 0: f60001c000040150
mce: [Hardware Error]: RIP !INEXACT! 33:<0007fadb0e68bea>
mce: [Hardware Error]: TSC 25d1e1dc9 ADDR 1605392958
mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1605392958 SOCKET 0 APIC 2 microcode dc
mce: [Hardware Error]: Run the above through 'mcelog --ascii'
mce: [Hardware Error]: Machine check: Processor context corrupt
Kernel panic - not syncing: Fatal machine check
Kernel Offset: 0x38600000 from 0xfffffffff81000000 (relocation range: 0xfffffffff8000000-0xffffffffbffffff)
Rebooting in 30 seconds..

CPU:i7-6700K
GPU:GTX-1070
主板:ASUS Z170-P
UEFI BIOS:3805 x64 2018 年 5 月 16 日(撰写本文时为最新版本)
ME 固件版本:11.8.55.3510(撰写本文时为最新版本)
我想知道是否可以使用超过 1/8 vCPU(每个 4 个物理核心 x 2 个虚拟核心)。

答案1

这看起来像是你的 CPU 或 RAM 的硬件故障。由于你尝试过不同的发行版,所以很明显,你的问题描述如下这里

更多信息关于“MCE”错误...

答案2

经过多次尝试并失败的启动选项测试后,我来到了一个论坛帖子https://ubuntuforums.org/showthread.php?t=1084622建议使用以下启动选项,我已经测试过,Kubuntu 20.10 可以启动,使用所有 CPU,并且在前 3 小时 45 分钟内不会自行崩溃:

noapic pci=assign-busses apicmaintimer idle=poll reboot=cold,hard

uname-rsv 版本

Linux 5.8.0-29-generic #31-Ubuntu SMP Fri Nov 6 12:37:59 UTC 2020

正在使用的 Kubuntu 二进制文件:

vmlinuz-5.8.0-29-generic

相关内容