我理解,当 RAID 配置中的磁盘发生故障时,无论您使用的 RAID 级别是什么(1、5、6 或 10),您都需要更换发生故障的磁盘并重建阵列。现在有了大容量、消费级磁盘,重建期间遇到 URE 的概率相当高。
我不明白的是接下来会发生什么?这是否意味着整个阵列立即变得无用,需要从备份中恢复(我猜是在更换导致 URE 的磁盘之后),或者它是否仍可以在降级模式下工作(如果配置允许的话)?
答案1
一般来说,阵列重建一旦遇到 URE 就会停止,这就是它值得关注的原因。
RAID 控制器正在尝试重建阵列,以便其数据与需要重建之前的数据 100% 准确。如果它无法做到这一点(由于 URE 等),则重建失败。此时您需要测试每个磁盘,如果测试结果正常(并且您信任它们),则从备份中恢复。
以 RAID5 为例。它可以容忍 1 个驱动器故障。因此,如果驱动器发生故障,则开始重建。发生 URE,因此要么读取的驱动器有问题,要么因为控制器认为有问题,此时驱动器被标记为离线。因此,这意味着现在 RAID 中有两个驱动器发生故障,而 RAID 一次只能处理 1 个驱动器故障。
也许还可以查看这个相关的 SU 问题:为什么 URE 无法重建 RAID 并导致“RAID 5 不可用”