FakeRAID 阵列失败,为什么?

FakeRAID 阵列失败,为什么?

我们有一个带有 AMD 主板 (GA-890GPA-UD3H) 的 Windows XP 系统,并且我们正在使用板载 RAID 功能。系统配置为 RAID 1(使用工具 AMD RAIDXpert)。它由两个 500GB Samsung HD502IJ 硬盘组成。

问题是阵列经常出现故障。给出的错误消息是:Logical drive goes critical.因此,驱动器不再镜像。

我可以重建驱动器,但这没有多大帮助。错误不定期/不稳定地重复出现。有时 3 天后失败,有时 7 天后失败,因此不稳定。

问题是什么?我该如何证明?我可以获得驱动器上的 SMART 信息,它们单独来看都没有问题。

答案1

在各种 NAS(带有硬件 RAID)中安装的消费级(WD 和 Hitachi)硬盘也遇到了同样的问题。

经过多次实验,我发现我的问题与磁盘处理读取延迟和超时的不同方式有关。

我必须在驱动器固件上启用 TLER/CCTL。从那时起,阵列就可以完美运行。

也可以看看http://en.wikipedia.org/wiki/Error_recovery_control

答案2

我在使用三星硬盘和 AMD 芯片组(在 HP 微型服务器中)时遇到过很多问题。我认为是 780G 芯片组。

我使用 Linux,当驱动器吞吐量很高时,我会收到日志消息,抱怨控制器没有及时响应并被重置。最终它破坏了阵列。关闭 AHCI 并降级到 SATA1 有点帮助,但并没有完全解决问题。

有一位拥有相同硬件的朋友在 Windows Home Server 上遇到了同样的问题,但我不记得日志上写了什么。

您可以在 eventvwr 中看到有关驱动器的任何信息吗?

相关内容