运行omreport chassis
结果:
Health
Main System Chassis
SEVERITY : COMPONENT
Ok : Fans
Ok : Intrusion
Critical : Memory
Ok : Power Management
Ok : Processors
Ok : Temperatures
Ok : Voltages
Ok : Hardware Log
Ok : Batteries
For further help, type the command followed by -?
运行dcicfg command=clearmemfailures
以清除 SBE 失败:
Clearing failures using mask: 31
DIMM_X1 : failed status: 270
根据此消息,假设应该在导致问题的内存上发出命令。
通过执行查阅帮助dcicfg command=clearmemfailures -?
得到以下结果:
Dell(R) Data Engine Data Engine Configuration Utility 7.4.0 (BLD_1)
Copyright (C) Dell Inc. 1995-2013
Usage: dcicfg command=COMMAND [PARAMETERS...] [OPTIONS...]
COMMAND:
clearmemfailures Clear memory device failure mode
PARAMETERS:
listonly=BOOLN (opt.) list all occupied memory connectors
connectors=STRING (opt.) memory device connector name (default=all)
failures=STRING (opt.) failure type to clear (default=all)
正在运行omreport chassis memory
表明哪个内存导致了该问题:
Index : 3
Status : Critical
Connector Name : DIMM_Y1
Type : DDRY - Synchronous Unregistered (Unbuffered)
Size : Y MB
并发出dcicfg command=clearmemfailures connectors=DIMM_Y1
指示无法找到内存连接器:
Clearing failures using mask: 31
failed to find any memory connector based on the names provided
omreport chassis memory index=3
表示内存抛出了SBE:
Memory Device Information
Health : Critical
Status : Critical
Device Name : DIMM_Y1
Size : Y MB
Type : DDRY Synchronous Unregistered (Unbuffered)
Speed : Y ns
Rank : Dual
Failures : Single-bit warning error rate exceeded.
Single-bit failure error rate exceeded.
问题
- 失败状态代表什么意思
270
? - 为什么已指定内存连接器并且它存在但却找不到?
- 如何清除 SBE?
尝试解决问题
以下命令来自此问答:
- sudo omconfig 系统 esmlog 操作 = 清除
- sudo omconfig 系统警报日志操作 = 清除
已发出清除 SBE 的命令,但Critical
内存状态仍然存在。
答案1
我在使用 清除 SBE 日志时遇到了麻烦dcicfg
。以下步骤对我有用:
下载戴尔支持实时图像(下载链接位于此链接底部)
- 使用“基于 DOS 的诊断工具(Dell 9G-10G 服务器)”或“基于 DOS 的诊断工具(Dell 11G 服务器)”选项启动系统。系统将显示客户诊断菜单版本 1.6。
- 当显示 Enter 选项或字母时,按 <4> 键。显示 MS-DOS 提示符。
- 键入 C:,然后按 < Enter >。当前驱动器更改为 C:。
- 键入“mpmemory –ptech -tlogclr”,然后按 < Enter >。
答案2
我也遇到了同样的问题。在命令前只使用 sudo 不起作用。
运行sudo su -
然后调用/path/to/dcicfg command=clearmemfailures
。