启动期间控制台中显示 CPU 错误消息 - “CPU1:卡住??”

启动期间控制台中显示 CPU 错误消息 - “CPU1:卡住??”

我最近在服务器上安装了第二个 CPU。该 CPU 与第一个完全相同,并且在安装之前我已验证该 CPU 工作正常。

服务器启动了,我顺利安装了 CentOS 6。

POST 屏幕识别两个 CPU--屏幕截图:http://pasteboard.co/bOY8M04.png

然而,第一次启动时我注意到控制台上出现一条奇怪的错误消息,显示“CPU1:卡住??”——截图:http://pasteboard.co/bOWvk1c.png

通过查看 /var/log/messages,我发现了有关此错误的更多调试输出:

Sep 13 18:01:58 customer kernel: Kernel panic - not syncing: Fatal exception
Sep 13 18:01:58 customer kernel: Pid: 0, comm: swapper Tainted: G      D    ---------------    2.6.32-431.29.2.el6.x86_64 #1
Sep 13 18:01:58 customer kernel: Call Trace:
Sep 13 18:01:58 customer kernel: [<ffffffff8152873c>] ? panic+0xa7/0x16f
Sep 13 18:01:58 customer kernel: [<ffffffff8152ca74>] ? oops_end+0xe4/0x100
Sep 13 18:01:58 customer kernel: [<ffffffff81010e0b>] ? die+0x5b/0x90
Sep 13 18:01:58 customer kernel: [<ffffffff8152c552>] ? do_general_protection+0x152/0x160
Sep 13 18:01:58 customer kernel: [<ffffffff8152bd25>] ? general_protection+0x25/0x30
Sep 13 18:01:58 customer kernel: [<ffffffff8103eb79>] ? native_write_cr4+0x9/0x10
Sep 13 18:01:58 customer kernel: [<ffffffff81050a2e>] ? syscall32_cpu_init+0x6e/0x80
Sep 13 18:01:58 customer kernel: [<ffffffff8151bea2>] ? xsave_init+0x31/0x48
Sep 13 18:01:58 customer kernel: [<ffffffff8151be45>] ? fpu_init+0x7e/0xaa
Sep 13 18:01:58 customer kernel: [<ffffffff8151df1b>] ? cpu_init+0x309/0x35f
Sep 13 18:01:58 customer kernel: [<ffffffff81521fcd>] ? start_secondary+0xd/0x2ef
Sep 13 18:01:58 customer kernel: [<ffffffff81521fc0>] ? start_secondary+0x0/0x2ef
Sep 13 18:01:58 customer kernel: CPU1: Stuck ??
Sep 13 18:01:58 customer kernel: #2 #3
Sep 13 18:01:58 customer kernel: general protection fault: 0000 [#2] SMP
Sep 13 18:01:58 customer kernel: last sysfs file:
Sep 13 18:01:58 customer kernel: CPU 3
Sep 13 18:01:58 customer kernel: Modules linked in:
Sep 13 18:01:58 customer kernel:
Sep 13 18:01:58 customer kernel: Pid: 0, comm: swapper Tainted: G      D    ---------------    2.6.32-431.29.2.el6.x86_64 #1 Supermicro X7DWT/X7DWT

以下是启动期间 /var/log/messages 的完整输出:http://pastebin.com/b3wfmLX6

系统启动后,如果我运行,则cat /proc/cpuinfo只会显示四个核心。

有谁知道是什么原因导致了这些错误?

答案1

嗯,看起来像是 Supermicro。你是当然你的硬件健康吗?

这只需要采取故障排除步骤。

  • 尝试在没有新 CPU 的情况下启动。
  • 尝试交换物理 CPU。
  • 排除 CPU 插槽导致的原因。
  • 根据这些结果采取适当的行动。

相关内容