封装温度高于阈值，CPU 时钟受到限制

Question 1

从 ILO 网络界面打开系统的 IML 日志并查看其报告的事件。

这是检查 HPE 服务器设备硬件状态的权威方法。

Answer

从 ILO 网络界面打开系统的 IML 日志并查看其报告的事件。

这是检查 HPE 服务器设备硬件状态的权威方法。

Question 2

我能够通过更新操作系统中的内核来解决这个问题。我现在使用的是 4.18.13-1.el7.elrepo.x86_64，报告的温度与 iLO UI 中的不同，但 CPU 温度和“高温”之间的比率要好得多，并且与 iLO 比率更加一致。

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +74.0°C  (high = +86.0°C, crit = +96.0°C)
Core 0:        +72.0°C  (high = +86.0°C, crit = +96.0°C)
Core 2:        +72.0°C  (high = +86.0°C, crit = +96.0°C)
Core 3:        +74.0°C  (high = +86.0°C, crit = +96.0°C)
Core 4:        +71.0°C  (high = +86.0°C, crit = +96.0°C)

Answer

我能够通过更新操作系统中的内核来解决这个问题。我现在使用的是 4.18.13-1.el7.elrepo.x86_64，报告的温度与 iLO UI 中的不同，但 CPU 温度和“高温”之间的比率要好得多，并且与 iLO 比率更加一致。

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +74.0°C  (high = +86.0°C, crit = +96.0°C)
Core 0:        +72.0°C  (high = +86.0°C, crit = +96.0°C)
Core 2:        +72.0°C  (high = +86.0°C, crit = +96.0°C)
Core 3:        +74.0°C  (high = +86.0°C, crit = +96.0°C)
Core 4:        +71.0°C  (high = +86.0°C, crit = +96.0°C)

Question 3

英特尔的热监控会导致许多不同的“温度”，具体取决于您使用的接口/MSR。此外，不同的处理器可能具有基于制造的不同阈值。

可能还想尝试一下 UEFI 中的一些热调节。有“最大冷却”选项可以让你避免达到阈值。

最后，记下您使用的选件卡，看看是否有任何影响。IO 卡可能会使热监控出错，从而使 FW/OS SW 认为系统处于热故障状态。

Answer

英特尔的热监控会导致许多不同的“温度”，具体取决于您使用的接口/MSR。此外，不同的处理器可能具有基于制造的不同阈值。

可能还想尝试一下 UEFI 中的一些热调节。有“最大冷却”选项可以让你避免达到阈值。

最后，记下您使用的选件卡，看看是否有任何影响。IO 卡可能会使热监控出错，从而使 FW/OS SW 认为系统处于热故障状态。

封装温度高于阈值，CPU 时钟受到限制

答案1

答案2

答案3

相关内容