如何确定固件 RAID 中的哪个驱动器发生故障

如何确定固件 RAID 中的哪个驱动器发生故障

我在 Intel ICH10 RAID 1 中有两个驱动器。它们不是企业级驱动器;只是普通的 WD Caviar Black 驱动器。

最近,镜像卷的读写变得非常慢,并且硬盘灯一直亮着。我怀疑这可能是由于其中一个磁盘即将发生故障并试图扇区重映射。 (也可以看看强制硬盘重新分配坏扇区并丢弃数据的最快方法是什么?)。如果这是企业级硬盘,它会快速而干净地失效,但这种行为是消费级硬盘的典型特征。因此,无法立即确定哪个硬盘坏了。

两个驱动器均未显示有问题的 SMART 数据(这是来自英特尔固态硬盘工具箱这似乎是从英特尔固件 RAID 读取 SMART 数据的少数几个选项之一):

首次驾驶

在此处输入图片描述

第二次驾驶

在此处输入图片描述

不幸的是,WD数据救生员诊断能够运行 SMART 测试的工具完全被 Intel ICH10 RAID 搞糊涂了:

在此处输入图片描述

我如何知道哪个驱动器有问题并将其换出?

答案1

从你所描述的情况来看,第一次驾驶有缺陷。Read Error Rate并且Re-allocated Sector Count不为零。重新分配扇区正是驱动器无法读取扇区时发生的情况。然后它将在下一次写入操作时重新分配该扇区。

您可以采取以下几种措施来确认诊断:

简单但不确定:使用类似的工具硬盘扫描扫描磁盘,即读取磁盘上的每个扇区。您也可以在 RAID 1 阵列上执行此操作。但由 RAID 固件决定是否读取磁盘 1 或磁盘 2 中的数据。因此,此方法不会检查两个磁盘上的每个扇区。但如果磁盘 1 即将发生故障,则很有可能(但不保证)其 SMART 值会恶化。

留意Re-allocated Sector CountReallocation Event CountCurrent Pending Sector Count。如果这些值上升,您的驱动器可能很快就会出现故障。

虽然复杂,但更确定:

  1. 将您的驱动器安装在不同的电脑/USB 外壳/不同的 SATA 端口上。
  2. 从 Live CD 启动(例如 Ubuntu 或 Knoppix)。
  3. 执行只读测试您的驱动器。您可以通过 SMART 命令和/或使用类似dd或的工具来执行此操作badblocks
    • 不要尝试挂载文件系统
    • 不要写任何事物到驱动器
    • 当您执行只读操作时,您可以重新组装 RAID,而不会将其标记为故障/不一致。
  4. 留意上述相同的值。现在您也应该能够正确读取 SMART 值。SMART 通常还会记录之前发生的错误。驱动器 1 至少记录了其中两个错误。时间戳通常以通电时间表示。因此,您必须从当前通电时间计算回来,看看这是否与您遇到问题的时间相关。

相关内容