如果 COLO 温度达到或超过 35C 左右,为什么会导致服务器重新加载或关闭?

如果 COLO 温度达到或超过 35C 左右,为什么会导致服务器重新加载或关闭?

高温情况下,服务器关闭或重新加载的原因是什么?例如,如果运行 Junos OS 的 Juniper 网络设备的 CPU 温度持续高于 100C 超过 60 秒,它将停止路由引擎:

Jun  3 00:40:32  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_WARNING: Routing Engine 0 temperature (101 C) over 100 degrees C, platform will shutdown in 15 seconds if condition persists
Jun  3 00:40:32  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_WARNING: Routing Engine 0 temperature (101 C) over 100 degrees C, platform will shutdown in 15 seconds if condition persists
Jun  3 00:40:37  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_WARNING: Routing Engine 0 temperature (102 C) over 100 degrees C, platform will shutdown in 10 seconds if condition persists
Jun  3 00:40:37  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_WARNING: Routing Engine 0 temperature (101 C) over 100 degrees C, platform will shutdown in 10 seconds if condition persists
Jun  3 00:40:42  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_WARNING: Routing Engine 0 temperature (102 C) over 100 degrees C, platform will shutdown in 5 seconds if condition persists
Jun  3 00:40:42  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_WARNING: Routing Engine 0 temperature (101 C) over 100 degrees C, platform will shutdown in 5 seconds if condition persists
Jun  3 00:40:47  M10i chassisd[1209]: CHASSISD_RE_OVER_TEMP_SHUTDOWN: Routing Engine 0 temperature above 100 degrees C for too long; powering down all FRUs

但是,服务器呢?这取决于服务器硬件供应商吗?还是仅取决于服务器操作系统?

答案1

这取决于服务器硬件供应商吗?还是仅取决于服务器操作系统?

两者之一/两者 - 如果服务器有温度传感器,而有些没有,那么它们通常可以在 BIOS 中设置硬限制,但内部的操作系统或驱动程序可能会因某种原因覆盖这些阈值。

所以是的,两者皆有 - 无论哪种方式你都需要传感器,这也是我购买 HP 的原因之一 :)

答案2

两者兼而有之,但你需要安装温度传感器才能做任何事情。所以...确保你购买的设备有温度传感器。

大多数基于硬件的解决方案在 BIOS 本身中都有一个热跳闸阈值。根据操作系统的支持,热跳闸可能看起来像是突然断电(别介意您拥有的所有花哨的电源保护)或用户发起的安全关机。对于网络交换机等嵌入式设备,硬件和操作系统之间的界限更加模糊;您的 JunOS 设备足够智能,可以在温度高于某个阈值时关闭高压组件。

相关内容