我们有一个 16 驱动器 RAID-6,其中三个驱动器有问题。两个已经坏了,第三个发出 SMART 警告。(别在意它怎么会变成这样糟糕的状态。)
显然,我们希望先更换损坏的驱动器,然后再更换仍在运行的驱动器,但更好的做法是:
更换一个坏掉的驱动器,让 RAID 重建,然后更换另一个,并让其再次重建;或者
同时更换两个驱动器并让其并行重建两个驱动器?
换句话说,重新引入一个或两个驱动器是否可以更快地恢复冗余状态?同时重建两个驱动器是否会减慢重建过程?
如果重要的话,控制器是 3ware 9650SE-16ML。
答案1
!!!!! 一 !!!!!
一次只做一件事,认真点,老兄,不要想用任何其他方式来做这件事,好吗。
其他任何事情都会考验您的整个系统恢复技能。
答案2
您有近期的良好备份吗?如果没有,您认为您能在合理的时间内获得它们吗?
老实说,我更担心在重建过程中损坏的驱动器会离线,而不是其他任何事情 - 如果您已经抛出 SMART 错误,那么您已经成功了一半以上。
我的建议是确认您的备份,然后一次重建一个驱动器,以尝试恢复到可以替换引发 SMART 错误的驱动器的状态(首先是死驱动器,最后是软错误)。
如果您没有备份,那么这将是一场赌博:备份可能会产生足够多的软错误,从而将边缘驱动器标记为故障,就像尝试重建一样。
答案3
我认为将其更改为“一次一个磁盘”没有任何意义。
显然,如果 RAID 能够同时“重新同步”两个磁盘(无论如何都失败了)您只能让整个 RAID 恢复承受最多 2 次故障的能力快点。
答案4
我的0.02美元
由于服务器已经处于离线状态,请在即将出现故障的驱动器上运行 ddrescue,将其克隆到另一个正常的驱动器。
然后将新的、正常的驱动器放入阵列中。如果克隆成功,您将避免在 2 次重建期间看到该驱动器发生故障的风险。