dmesg 中“GHES: HEST 未启用!”的含义

dmesg 中“GHES: HEST 未启用!”的含义

重新启动 SuSE 12 主机后,我查看dmesg并发现了以下信息

    GHES: HEST is not enabled!

GHES 显然是指“APEI 通用硬件错误源支持”。是否应启用 GHES/HEST?它有什么好处?如果可取的话,如何实现?

答案1

我在生产中拥有几台 SLES 机器,但从未使用过它。以下是一个很好的概述:https://firmware.intel.com/sites/default/files/resources/A_Tour_beyond_BIOS_Implementing_APEI_with_UEFI_White_Paper.pdf

硬件错误源表 (HEST) HEST 表使主机固件能够声明平台组件可能生成的所有错误以及这些错误发出的错误信号。主机固件应在 HEST 中为每个组件(例如,处理器、PCIe 设备、PCIe 桥等)和每种错误类型创建错误源条目,并为操作系统提供相应的错误通知机制(单向)。这些错误条目包括 x86 架构错误、行业标准错误和平台错误的通用硬件错误源。x86 架构错误、MCE 和 CMC 以及标准错误 PCIe AER、MSI 和 PCI INTx 可由操作系统原生处理。通用硬件错误源可用于所有固件 1st 错误和没有操作系统原生信号的平台错误(例如内存、板逻辑),因此它们必须使用平台信号 SCI 或 NMI。

我想如果你真的想监控所有硬件错误这可能会有用。

相关内容