在之前的一条消息中,我询问了如何在具有 4 个磁盘的 RAID 5 阵列中重建故障磁盘。我已安装新驱动器(驱动器 4)来代替故障磁盘并开始重建。在重建过程中,另一个磁盘(驱动器 2)开始出现 ECC 错误和超时。在重建过程的 95% 时,计算机重新启动并挂在启动屏幕上,控制器(3ware 9500s)显示错误(未找到驱动器 2),并且可以听到故障驱动器(驱动器 2)发出的典型噪音。我关闭并打开 PC 几次,没有任何变化。然后我将 PC 关闭了一个小时。再次打开,此时丢失的驱动器(驱动器 2)已恢复原位。我可以启动等待重建的操作系统,自动从控制器启动。在某个时候,控制器启动时给出重建错误并停止重建过程。服务器现在正在运行,驱动器 2 出现错误,驱动器 4 处于正常状态,但由于重建过程无法完成,因此性能下降。看起来我走进了死胡同:至少需要 3 个驱动器正常才能使事情顺利进行,但是一个驱动器有错误,一个驱动器无法重建。我该尝试什么?
答案1
最好的办法是从备份中恢复。但我猜你没有备份,否则你就不会问这个问题了。
因此,如果备份失败,下一个最好的选择是尽可能多地复制数据(从情况来看,您至少会有几个无法读取的扇区无法复制),使用您喜欢的任何方法 - 文件复制、磁盘映像、磁盘级复制等。然后,一旦您有了数据,您就可以更换有故障的驱动器,创建一个新的 RAID 阵列并将数据复制回来。
否则,您可以选择昂贵的专业数据恢复过程,或者只是接受数据丢失并继续前进,这取决于您的数据对您来说有多大的价值。
答案2
最简单的方法是从备份中恢复。但你问这个问题可能是因为你没有备份。在这种情况下,你会打电话给磁盘驱动器恢复中心,看看他们能为你做些什么。
当您最终重建它时,您就会了解有效的备份系统的真正价值。
答案3
你能展示一下输出吗twcli /c0 show all
?
如果驱动器 2 处于ECC-ERROR
状态,您可以通过告诉控制器忽略驱动器 2 上的 ECC 错误来继续重建。
@Sergey Vasilov 在此主题中的回答3Ware 的 tw_cli 中的“DEGRADED”磁盘和“ECC-ERROR”是什么意思?有正确的信息。(我以前是随口就知道这一点的,但不得不查找命令,而 Sergey 的回答在谷歌搜索中是第一个找到的,所以我会把功劳归于他)。因为引用答案总是更好的:
/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off
即使这允许您重建阵列,您仍可能会遇到文件系统损坏或数据丢失的情况。或者可能不会。
答案4
@Daniel 这是 tw_cli 的输出
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-5 DEGRADED - - 64K 698.461 ON ON
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 233.76 GB 490234752 V503YE9G
p1 ECC-ERROR u0 233.76 GB 490234752 V503Y7VG
p2 OK u0 233.76 GB 490234752 V503Y4GG
p3 DEGRADED u0 465.76 GB 976773168 WD-WCAYUJ776908
Name OnlineState BBUReady Status Volt Temp Hours LastCapTest
---------------------------------------------------------------------------
bbu On Yes OK OK OK 255 18-Nov-2006