我们有一台带有 3ware RAID 控制器的服务器,由于 ext4 日志中止,该服务器今天进入只读模式。我检查了 RAID 状态,发现以下奇怪的配置:
//host> /c3/u1 show
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u1 RAID-5 INOPERABLE - - - 64K 11175.8
u1-0 DISK OK - - p0 - 1862.63
u1-1 DISK DEGRADED - - - - 1862.63
u1-2 DISK DEGRADED - - - - 1862.63
u1-3 DISK DEGRADED - - - - 1862.63
u1-4 DISK DEGRADED - - - - 1862.63
u1-5 DISK DEGRADED - - - - 1862.63
u1-6 DISK DEGRADED - - - - 1862.63
u1/v0 Volume - - - - - 11175.8
//host> /c3/u0 show
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u0 RAID-5 OK - - - 64K 11175.8
u0-0 DISK OK - - p7 - 1862.63
u0-1 DISK OK - - p1 - 1862.63
u0-2 DISK OK - - p2 - 1862.63
u0-3 DISK OK - - p3 - 1862.63
u0-4 DISK OK - - p4 - 1862.63
u0-5 DISK OK - - p5 - 1862.63
u0-6 DISK OK - - p6 - 1862.63
u0/v0 Volume - - - - - 11175.8
我在日志中还发现了以下几个警告:
c3 [Wed Oct 08 2014 02:08:02] WARNING Sector repair completed: port=7, LBA=0x27000380
还有一条稍旧的关于阵列不完整的消息,后跟“驱动器已插入:端口 = 0”消息。
p0 磁盘本应是备用磁盘,但突然间它成了阵列中唯一与主阵列完全相同的磁盘。知道这里发生了什么吗?
我解决这个问题的计划是从数组 u1 中删除 p0,删除整个数组 u1,并将 p0 标记为备用。之后,我将从数组中删除 p7,因为它似乎不可靠,并使用 p0 重建数组。
这看起来是个合理的计划吗?我有点担心,因为我不明白为什么有两个数组,以及到底发生了什么。
我知道 RAID 5 对于如此大的磁盘来说存在问题,但目前我无法改变这一点
答案1
这些是双通道 SAS 驱动器,两个通道都插入同一个控制器,这是有可能的吗?可能性不大,但这或许可以解释为什么驱动器会出现两次。
驱动器在 3Ware 控制器上保存配置,因此如果我说得没错,控制器可能会两次看到相同的配置,然后想知道为什么它只能写入一组磁盘。基于此,我不建议删除 U1。每个驱动器只连接一个通道,U1 应该会消失。
呼呼!