断电后令人担忧的高清相关消息

断电后令人担忧的高清相关消息

两周前,我的 BSD 服务器发生了停电,我的 UPS 认为这是一个失败的好时机。今天晚上刚刚启动它,却在我认为是重建过程中显示了以下错误。

在此输入图像描述

ECC 错误的端口在以下错误中显示为 2 或 1,虽然您在图像上看到的其余数据自表明重建开始以来尚未显示,但驱动器 ECC 错误已弹出一次两次自从显示该命令以来。

虽然我也有另一个系统来备份关键数据,但我的问题实际上是这是什么意思,以及我是否应该购买硬件。驱动器为 WD 250GB,采用硬件 RAID5,配有 3Ware 9650SE-4LPML 4 端口 3Gb/s RAID 卡。操作系统是FreeBSD 6.2

编辑:现在有些不同了。出现重试已用尽的错误,并产生以下行

g_vfs_dome():da0s1d[READ(offset=1155956736, length=16384)]error = 5

然后重置控制器并开始重建设备 -

答案1

您在这里应该做的是在坏驱动器上触发 SMART 自检。这将从这里拉出很多控制器/主板部件,并让您更好地阅读有问题的底层磁盘。非驱动器故障可能会给出错误的结果(电源故障是最常见的原因),但这是一个好的开始。运行扩展测试需要几个小时,但您可能会通过简短的测试获得足够有用的信息。发生故障的驱动器往往会很快抱怨,即使是在那个驱动器上。

使用指南SMART 监控 3ware RAID 中的驱动器应该为您提供足够的信息来触发自检,然后查看记录的结果。在运行新测试之前,可能值得在此处检查控制器卡日志以获取更多信息。了解停电前错误是否已经增加将会很有趣。有时,RAID 阵列可能隐藏着您不知道的不一致之处。断电可能会因写入不一致而损坏一个扇区,然后您不知道的问题会导致重建过程很糟糕。如果发生较旧的扇区修复,您可能会在控制器日志中找到它们,即使控制器悄悄地修复了它们并且没有告诉 Linux 驱动程序。

相关内容