如果一个 CPU 服务器发生故障,双 CPU 服务器还能运行吗?

如果一个 CPU 服务器发生故障,双 CPU 服务器还能运行吗?

现代服务器上的双 CPU 是否真的能提供冗余?如果其中一个 CPU 发生故障,服务器是否可以重新启动并在剩余的 CPU 上运行?

过去我遇到过这样的情况:CPU 0 必须始终存在,因此如果 CPU 1 发生故障,它会正常重新启动,但如果 CPU 0 发生故障,则必须将 CPU 1 物理交换到 CPU 0 插槽中。我希望这种限制在现代双 CPU 服务器中不再存在,但我想确认这一点。

HP 实际上告诉我说双 CPU 不提供任何冗余,因为它们必须同时存在,但我不确定这是否正确。

答案1

现代服务器上的双 CPU 是否真正提供了冗余?

是的,可能会。例如,处理器指令重试可在 Power 系统上使用,并且能够通过重试执行期间失败的指令(可能在不同的处理器上)从故障处理器中恢复。

然而,此功能在 Intel 或 AMD 等低端服务器上不可用。

如果一个出现故障,服务器可以重新启动并在剩余的 CPU 上运行吗?

是的,只要服务器硬件能够正确检测并从故障中恢复即可。我对 IBM Intel 服务器有丰富的经验,它们在从故障处理器中恢复并允许系统从另一个插槽启动方面非常出色。

答案2

现代服务器上的双 CPU 是否真正提供了冗余?

不。

如果一个出现故障,服务器可以重新启动并在剩余的 CPU 上运行吗?

有可能。视情况而定。如果它死机到无法被看到,那么 Bios 可能会假设只有一个 CPU 在运行,这可能是受支持的(大多数情况下是受支持的),尽管您可能会失去 RAM 访问权限(取决于 CPU - 有些将一半的 RMA 路由到每个 CPU)。

这一切都取决于 mOBO 在没有 CPU 的情况下如何处理这种情况 - 这是一个实施细节。

话虽如此,但在正常的服务器上 CPU 出现故障的情况却极为罕见。

相关内容