RAID10 上的单个磁盘故障导致数据不可用

RAID10 上的单个磁盘故障导致数据不可用

我这里遇到了一个奇怪的情况。我有一台带 PERC H310 迷你控制器的 Dell R620。有 2 个 RAID 阵列,一个用于操作系统的 2 磁盘镜像和一个用于数据驱动器的 6 磁盘 RAID 10。当 RAID10 中的一个磁盘发生故障时,我的数据将不可用,并在 Windows 磁盘管理中被列为无效。这是正常现象吗?我以为单个磁盘故障只会使其处于降级模式,直到添加新磁盘,但我却完全丢失了我的卷。顺便说一句,我上周遇到了 3 次磁盘故障。我不认为它们是相关问题,但我可能是错的。感谢您的帮助。

答案1

您说得完全正确,RAID-10 阵列中的单个磁盘故障不应导致卷不可用。您的 PERC 控制器可能有问题。

您应该进入 Dell OpenManage Server Administrator 或 iDRAC,查看是否有任何信息报告。您还可以检查 Windows 事件日志(如果已安装 OSMA 并配置为将事件写入这些日志)。

如果您的控制器或背板有可用的固件和/或驱动程序更新,请考虑安装它们。如果可能的话,我建议在阵列正常运行时执行此操作。

也可能有多个磁盘发生故障。具体取决于哪个如果 RAID-10 组中的磁盘发生故障,您可能会丢失多个磁盘(在您的情况下最多 3 个),而阵列不会脱机;但是,如果您只丢失两个磁盘,但它们位于同一个 RAID-1 对中,那么整个阵列都会瘫痪。

如果您的系统仍在保修期内,请不要忘记联系戴尔支持。他们非常擅长帮助诊断此类问题。

答案2

一周内发生三块磁盘故障并非不可想象,尤其是当它们同时投入使用且磨损程度相同时。但是,如果我遇到这种情况,我会开始怀疑控制器或背板。

您能进入 iDRAC 并查看日志中是否有有关 RAID 控制器的故障吗?

另外,您是否对发生故障的磁盘和当前正在运行的成员运行 SMART 检查?这将揭示磁盘本身是否损坏,并为您提供有关它们可能如何发生故障的线索。该应用程序smartctl是套件的一部分smartmontools,可在 Windows 环境中安装和使用。请参阅手册页以了解如何通过 RAID 控制器访问驱动器,特别是 -d 选项。

相关内容