清除所有和特定连接器的 Dell OpenManage SBE 内存日志,无需重新启动服务器

清除所有和特定连接器的 Dell OpenManage SBE 内存日志,无需重新启动服务器

运行omreport chassis结果:

Health

Main System Chassis

SEVERITY : COMPONENT
Ok       : Fans
Ok       : Intrusion
Critical : Memory
Ok       : Power Management
Ok       : Processors
Ok       : Temperatures
Ok       : Voltages
Ok       : Hardware Log
Ok       : Batteries

For further help, type the command followed by -?

运行dcicfg command=clearmemfailures以清除 SBE 失败:

Clearing failures using mask: 31
DIMM_X1 : failed status: 270

根据此消息,假设应该在导致问题的内存上发出命令。

通过执行查阅帮助dcicfg command=clearmemfailures -?得到以下结果:

Dell(R) Data Engine Data Engine Configuration Utility  7.4.0 (BLD_1)
Copyright (C) Dell Inc. 1995-2013

Usage: dcicfg command=COMMAND [PARAMETERS...] [OPTIONS...]

COMMAND:
  clearmemfailures    Clear memory device failure mode

PARAMETERS:
  listonly=BOOLN      (opt.) list all occupied memory connectors
  connectors=STRING   (opt.) memory device connector name (default=all)
  failures=STRING     (opt.) failure type to clear (default=all)

正在运行omreport chassis memory表明哪个内存导致了该问题:

Index          : 3
Status         : Critical
Connector Name : DIMM_Y1
Type           : DDRY - Synchronous Unregistered (Unbuffered)
Size           : Y  MB

并发出dcicfg command=clearmemfailures connectors=DIMM_Y1指示无法找到内存连接器:

Clearing failures using mask: 31
failed to find any memory connector based on the names provided

omreport chassis memory index=3表示内存抛出了SBE:

Memory Device Information

Health : Critical

Status      : Critical
Device Name : DIMM_Y1
Size        : Y MB
Type        : DDRY Synchronous Unregistered (Unbuffered)
Speed       : Y ns
Rank        : Dual
Failures    : Single-bit warning error rate exceeded.
              Single-bit failure error rate exceeded.

问题

  1. 失败状态代表什么意思270
  2. 为什么已指定内存连接器并且它存在但却找不到?
  3. 如何清除 SBE?

尝试解决问题

以下命令来自此问答

  1. sudo omconfig 系统 esmlog 操作 = 清除
  2. sudo omconfig 系统警报日志操作 = 清除

已发出清除 SBE 的命令,但Critical内存状态仍然存在。

答案1

我在使用 清除 SBE 日志时遇到了麻烦dcicfg。以下步骤对我有用:

下载戴尔支持实时图像(下载链接位于此链接底部)

  1. 使用“基于 DOS 的诊断工具(Dell 9G-10G 服务器)”或“基于 DOS 的诊断工具(Dell 11G 服务器)”选项启动系统。系统将显示客户诊断菜单版本 1.6。
  2. 当显示 Enter 选项或字母时,按 <4> 键。显示 MS-DOS 提示符。
  3. 键入 C:,然后按 < Enter >。当前驱动器更改为 C:。
  4. 键入“mpmemory –ptech -tlogclr”,然后按 < Enter >。

答案2

我也遇到了同样的问题。在命令前只使用 sudo 不起作用。

运行sudo su -然后调用/path/to/dcicfg command=clearmemfailures

相关内容