硬件错误和 mcelog

硬件错误和 mcelog

mcelog 是守护进程、cron 作业还是什么?如何强制检查?还有哪些其他方法可以扫描 Linux 上的硬件错误?

答案1

嗯,mcelog网站为您列出:

mcelog 守护进程以各种方式记录内存和一些其他错误。mcelog --client可用于查询正在运行的守护进程。

答案2

我使用以下命令在 SLES 11 SP2 上解码 mcelog 日志文件:

sudo mcelog --dmi --ascii < /var/log/mcelog

请记住麦克洛格人页:

使用 −−dmi 选项,mcelog 将在 BIOS 的 SMBIOS/DMI 表中查找机器检查中报告的地址。这有时可以告诉您哪个 DIMM 或内存控制器出现了问题。更常见的是,BIOS 报告的信息要么明显错误,要么隐晦错误或毫无用处。此选项要求 mcelog 具有对 /dev/mem 的读取权限(通常需要 root)并在与机器检查事件发生时相同的硬件配置中运行在同一台机器上。

相关内容