一个 CPU 的核心温度比另一个 CPU 高 10 度,这值得担心吗?

一个 CPU 的核心温度比另一个 CPU 高 10 度,这值得担心吗?

我们有一台新的戴尔服务器,配有一对 6 核 Xeon 2620,总共 12 个内核。使用 Speedfan/HW Monitor,我注意到与其中一个 CPU 相关的内核在负载下比另一个 CPU 运行温度高 10 度左右(60 多摄氏度 vs 50 多摄氏度)。空闲时,数字稍微接近一些,但最热的内核空闲时温度约为 45 度,最冷的内核空闲时温度约为 35 度左右,但两组轨迹并不像在负载下那样明显,在负载下显然有两组温度。

我已经有一段时间没有构建和运行自己的服务器了,但是如果这是我自己构建的家用计算机,我可能会拆下散热器并重新涂上一些北极银或类似的东西,确保所有紧固件都良好且紧固,诸如此类的事情。

请注意,这些芯片的最高温度是 77 度,所以我们不会遇到任何危险,但我想知道这是否是我应该解决的问题。

谢谢。

答案1

我猜想这与正在运行的进程和应用程序的处理器亲和性有关。如果一个 CPU 上运行的进程/应用程序多于另一个 CPU,那么它自然会运行得更热。如果两个 CPU 的温度都在“安全”范围内,那么我就不会特别担心这个问题。

答案2

对于该型号来说,这很可能是完全正常的。在某些情况下,设计一个 CPU 比另一个 CPU 获得更多的气流 - 但它们都至少获得足够的气流以保持冷却,情况似乎就是这样。对于 12 个核心,也可能一组比另一组使用得更频繁,尤其是在服务器没有全速运行时 - 这是一件好事,它可以让整个 CPU 在不需要时进入低功耗模式以节省电力。

其他可能对其产生影响的因素包括,一个 CPU 更靠近较热的东西 - 硬盘、电源、RAID 控制器芯片、RAM 等。

如果这是新设备,您刚刚设置它(尚未投入生产),我会从启动菜单运行板载诊断程序,并确保所有风扇正常工作。如果您的服务器配有 iDRAC,您还可以连接到 BCM 并在那里检查状态。或者安装实际的戴尔管理软件进行检查。

这可能不是问题 - 就我个人而言,我会进行一两天的老化测试,看看它到底有多热。如果它从未接近 CPU 的最大值,我就不会担心。

答案3

这种事情很正常。气流、热管布置和不完全平衡的负载都可能导致这种情况。即使是不同类型的负载也会导致不同处理器之间的功耗不同,从而导致散热不同。此外,这完全无关紧要,因为无论如何,所有处理器的运行温度都应该远低于其最高运行温度。

如果热的风扇实际上已经接近危险温度,或者您看到风扇坏了或出现其他问题,请向供应商反映。否则,请忽略它。

相关内容