安装 Ubuntu 时发生机器检查错误(包括日志图像)

安装 Ubuntu 时发生机器检查错误(包括日志图像)

以下是日志的图像:图片在这里。此时安装过程挂起。Kernel panic未显示消息。

在我从菜单中选择“安装 Ubuntu”后不久,MCE(在图像底部)就出现了。我不知道CPU 0 ...、、或是什么意思。有人能解释一下吗?并且,根据您的经验或专业知识,触发这些消息的问题可能是什么?RAM、CPU、PSU 还是其他什么?Bank 7 ...TSC 0 ADDR <number> MISC <number>PROCESSOR 0:306f2 TIME <number> SOCKET 0 APIC 0 microcode 2d

此外,日志中提到Run the above through mcelog --ascii。在这种情况下我可以在哪里运行这样的命令?

以下是我的设置的一些规格:

  • 使用 UNetBootin 创建的 Ubuntu 16.04 的 USB 记忆棒;
  • 处理器:Xeon E5-1650 v3;
  • 主板:华擎 X99 WS-E;
  • 电源:EVGA SUPERNOVA 1600 G2 120-G2-1600-X1;
  • RAM:16GB 288 针 SDRAM DDR4 2400 ECC 已注册;
  • GPU:EVGA GTX 680;

如果有任何有用的信息,请告诉我。我非常感谢您的帮助!

编辑:需要说明的是,我的电脑还没有安装任何操作系统。我正在从头开始构建它。我在尝试安装 Ubuntu 时遇到了这个问题。后来,我制作了一个 Windows USB 棒,但它也不起作用。Windows 徽标显示 5 秒后,屏幕变黑,什么也没发生。

答案1

解码机器检查异常错误的第一步是安装 mcelog 并运行:

sudo apt-get install mcelog
sudo mcelog --ascii

也许这将提供一些更人性化可读的内容。

答案2

MCE 错误通常是由硬件问题引起的。但是,在 Haswell、Broadwell 和 Skylake 处理器上,它们也可能是由过时的固件引起的,以绕过处理器错误/缺陷。Xeon E5-v3 处理器确实有几个 MCE 生成错误,因此需要相当最新的固件才能获得能够支持 Linux 的微码。

处理可能的硬件缺陷的程序是众所周知的,如果您搜索它们,您会在网络上找到大量信息和指南。我将从微代码/固件角度来回答,这个角度不太为人所知。

假设你并没有做任何愚蠢的事情,比如坚持尝试对报告 MCE 错误的系统进行超频/降压/降频(即确保主板的所有超频功能均处于非活动状态):

  1. 安装系统供应商提供的最新固件(BIOS / UEFI)更新,否则您很可能甚至无法安装 Linux 发行版,因为它会在安装结束前崩溃(或损坏已安装的映像)。

如果你在台式机主板上安装了 Xeon(似乎是这样,因为 EVGA 并不生产服务器/工作站级硬件),那么,你可能不得不向主板供应商索要新版 BIOS,其中包含英特尔最新的微代码和内存控制器固件,或者自己破解 BIOS,用英特尔最新的微代码更新其内置微代码——搜索 BIOS 修改论坛寻求帮助,但尝试先与 EVGA 联系,官方 BIOS 是很多更好的。

  1. 出现提示时安装 intel-microcode 包/“CPU 微码驱动程序”,只要固件具有足够新的微码来实际完成安装 Ubuntu 并启动系统而不崩溃,intel-microcode 包就可以用来修复大多数剩余的微码问题。

相关内容