在双 CPU 服务器上,一个 CPU 比另一个 CPU 运行得更热是正常的吗?

在双 CPU 服务器上,一个 CPU 比另一个 CPU 运行得更热是正常的吗?

我有一台双 Opteron 服务器,运行 Linux 和 libvirt,用于托管多个虚拟机。虚拟机运行良好,服务器处理正常,但我注意到一个 CPU 的运行温度始终在 69C 左右(节流阀为 70C),而另一个 CPU 的运行温度在 15C 左右。

这对我来说似乎不正常?它们的温度不应该更接近一点吗?

我不确定如何进一步诊断。也许其中一个 CPU 上的导热膏不够?

编辑:主板是华硕 KGPE-D16并采用双冷却Noctua NH-U9DO 风扇

请注意,我认为温度可能高于环境温度,而不是绝对值?当服务器空闲时,CPU 温度降至 2C 和 13C。我使用的是 lmsensors 配置这里

答案1

问题最终归结为散热器安装不当。也许安装不当并不是正确的描述。事实证明,你必须在散热器上涂导热膏,而不是在覆盖散热器的塑料盖上。

在此处输入图片描述

取下塑料盖后,CPU 看起来很酷,谢谢大家!

答案2

根据我的经验,机箱中的成对组件在不同温度下运行是正常的,因为气流在各处并不相同。这是我的 colo box 中的 HDD 温度图。驱动器是镜像的,因此它们上的工作负载几乎相同。

munin 过去一年的硬盘温度图表

如您所见,它们相互跟踪,但并不相同;它们的平均差异也只有 6 摄氏度。无论您的传感器报告的是绝对温度还是过热,在负载下 55 摄氏度的差异似乎非常错误。如果您确信数据是正确的,那么鉴于静态差异下降到 10 摄氏度(这是我看到的由于气流而产生的差异),我会怀疑散热器安装不当。

答案3

不是。除非你的气流存在严重问题。或者其中一个冷却器坏了。温度会变化 - 但变化不大(70 摄氏度 vs. 15 摄氏度)。

考虑到 15 度是多么低,我会假设 (a) 你的传感器已关闭(您真的将服务器存放在那么凉爽的房间里吗?)。

我还假设无论出于什么原因,其中一个 CPU 根本就没有做任何工作。

细微的差异很正常。可能存在一些较大的差异(我想到的是气流)。但这里我们讨论的是冷。

答案4

我不得不同意温度传感器有缺陷的说法,因为 15C 只是 59F!!! 除非计算机位于极其寒冷的数据中心,否则我猜想环境空气温度会高于 59F!您尝试将虚拟机分配到低温核心,看看是否有任何变化;如果没有,我高度怀疑传感器有故障。

您可能还想查看dmesg(启动消息)的输出并查看其中是否有任何异常情况。

相关内容