使用 3ware 控制器重建 raid5 的问题

使用 3ware 控制器重建 raid5 的问题

我有一个包含 8 个磁盘的降级阵列。

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-5    REBUILDING     26%     -       64K     1629.74   ON     OFF

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     OK               u0     232.88 GB   488397168     VDB41BT4DM3Z6C
p1     OK               u0     232.88 GB   488397168     VDB41BT4CMARDC
p2     DEGRADED         u0     232.88 GB   488397168     VDB41DT4EGWREC
p3     OK               u0     232.88 GB   488397168     VDB41BT4CHU1RC
p4     OK               u0     232.88 GB   488397168     VFA100R1CGR0LB
p5     DEVICE-ERROR     u0     232.88 GB   488397168     VDB41BT4CMJ5MC
p6     OK               u0     232.88 GB   488397168     VDB41BT4CMARYC
p7     OK               u0     232.88 GB   488397168     VDB41BT4CMJJHC

我更换了 处的故障磁盘p2,并开始重建,没有任何问题,但重建到大约 16% 时, 处的磁盘p5抛出了一个错误DEVICE-ERROR,从而暂停了重建过程。

当我重新扫描 ( tw_cli/ c3 rescan) 时,DEVICE-ERROR消失,重建重新开始。 大约 26% 时,这个DEVICE-ERROR再次出现,这次中断了重建过程,重建过程从 0% 开始。

这种情况已经持续了一周,我无法重建阵列。有没有办法忽略此问题DEVICE-ERROR,直到阵列重建完成?

答案1

是的,你做错了。你更换了故障磁盘,然后你重建了阵列。当然现在它不起作用了。你试图在坏磁盘上重建数据。这不会起作用。

我还建议,在当今这个时代,使用 8 个磁盘的 RAID5 不是一个好主意。

使用 RAID6,或者至少有一个热备用。磁盘不大,因此您可能能够使用现在的设置,但您也引入了一个不小的可能性,即重建过程将导致另一个磁盘发生故障(并破坏阵列)。


根据您更新的信息,您在修复这个阵列方面可能不太走运。

不过,在承认失败之前,最好先扫描磁盘以p5查找坏块或磁盘扇区,以防设备错误如此简单。如果是,您可以修复错误,继续重建,然后更换磁盘p5并再次重建。

假设这还不够,此时最好的方法是从阵列中复制数据(或从备份中恢复)。如果您没有备份,其中一些数据将被损坏/丢失 - 至少,当您尝试访问 P5 时,您会收到 DEVICE-ERROR 数据,因此您可能必须手动将这些文件或目录排除在复制过程之外。(当然,情况可能比这更糟糕,但无论如何,尽你所能就好)。

一旦数据安全了,或者您已经尽可能多地删除了数据,请以更好的格式重新创建阵列,然后再复制数据。我个人现在不会使用 RAID 1/10 或 6/60 以外的任何阵列,但这最终取决于您,但希望这能让您明白 RAID5 不是一个好主意。

相关内容