问题:
有没有办法强制重建?我也在考虑关闭系统并尝试在 3ware 控制器 BIOS 中重建它。如果我在当前状态下关闭此系统,它会重新启动吗?还是阵列会损坏并且无法启动?目前系统已启动并正常运行。
细节:
遇到一个坏阵列(已降级),其他三个正在初始化。我更换了坏磁盘并尝试重建。使用以下命令:
./tw_cli /c3/p1 remove
./tw_cli /c3 rescan
./tw_cli maint rebuild c3 u0 p1
RAID 阵列显示它正在重建,但自从我发出重建命令以来就没有移动过。
~ # ./tw_cli /c3/u0 show
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u0 RAID-10 REBUILDING 29% - - 256K 1862.61
u0-0 RAID-1 REBUILDING 0% - - - -
u0-0-0 DISK OK - - p0 - 465.651
u0-0-1 DISK DEGRADED - - p1 - 465.651
u0-1 RAID-1 INITIALIZING 62% - - - -
u0-1-0 DISK OK - - p2 - 465.651
u0-1-1 DISK OK - - p3 - 465.651
u0-2 RAID-1 INITIALIZING 40% - - - -
u0-2-0 DISK OK - - p4 - 465.651
u0-2-1 DISK OK - - p5 - 465.651
u0-3 RAID-1 INITIALIZING 16% - - - -
u0-3-0 DISK OK - - p6 - 465.651
u0-3-1 DISK OK - - p7 - 465.651
u0/v0 Volume - - - - - 1862.61
我尝试在启用和禁用重建计划的情况下重建阵列:
~ # ./tw_cli /c3 show rebuild
Rebuild Schedule for Controller /c3
========================================================
Slot Day Hour Duration Status
--------------------------------------------------------
1 Sun 12:00am 24 hr(s) enabled
2 Mon 12:00am 24 hr(s) enabled
3 Tue 12:00am 24 hr(s) enabled
4 Wed 12:00am 24 hr(s) enabled
5 Thu 12:00am 24 hr(s) enabled
6 Fri 12:00am 24 hr(s) enabled
7 Sat 12:00am 24 hr(s) enabled
我尝试过启用和禁用验证计划。
~ # ./tw_cli /c3 show verify
Verify Schedule for Controller /c3
========================================================
Slot Day Hour Duration Status
--------------------------------------------------------
1 Sun 12:00am 24 hr(s) enabled
2 Mon 12:00am 24 hr(s) enabled
3 Tue 12:00am 24 hr(s) enabled
4 Wed 12:00am 24 hr(s) enabled
5 Thu 12:00am 24 hr(s) enabled
6 Fri 12:00am 24 hr(s) enabled
7 Sat 12:00am 24 hr(s) enabled
另请注意,尝试将 ignoreECC 设置为 on 时会出现错误:
~ # ./tw_cli /c3/u0 show ignoreECC
/c3/u0 Ignore ECC policy = off
~ # ./tw_cli /c3/u0 set ignoreECC=on
Setting Ignore ECC Policy on /c3/u0 to [on] ... Failed.
(0x09:0x0005): (0x09:0x0005): Input/output error
编辑于 2018/3/15:
我想把发生的事情写下来,以防其他人遇到类似的情况。我不得不说,初始化卡住是真正让我感到困惑的部分。我知道有些 RAID 卡每周重新同步或验证一次阵列。(或者无论你安排它们什么时间。)我相信发生的事情是,它重新同步并验证了阵列,并且一个或多个驱动器在重新同步期间发生故障,导致“初始化”停止。
我给此 RAID 卡的支持人员发了电子邮件。([email protected]
)他们查看了日志和诊断,没有发现任何异常。他们最终的建议是:“更新固件。升级后重新启动。这可能有助于使其脱离暂停状态。”
我问他们在“初始化”状态下更新固件是否安全,以及他们是否确定在此状态下重新启动是否安全。他们从未回复那封电子邮件。
因为我谁也不信任,所以我备份了所有数据并重启了机器。结果又出现了两个坏盘。(它们是初始化 RAID1 阵列上的坏盘。)幸运的是,它们都在不同的 RAID1 阵列上,所以我可以更换坏盘。重启并重建阵列后,它们初始化了,现在一切都正常了。
因此,如果您发现此卡卡在“初始化”状态,我会备份数据,尝试重新启动,并祈祷坏磁盘位于不同的镜像上。
祝愿未来读到这篇文章的所有人都好运!
答案1
我想把发生的事情写下来,以防其他人遇到类似的情况。我不得不说,初始化卡住是真正让我感到困惑的部分。我知道有些 RAID 卡每周重新同步或验证一次阵列。(或者无论你安排它们什么时间。)我相信发生的事情是,它重新同步并验证了阵列,并且一个或多个驱动器在重新同步期间发生故障,导致“初始化”停止。
我给此 RAID 卡的支持人员发了电子邮件。([email protected]
)他们查看了日志和诊断,没有发现任何异常。他们最终的建议是:“更新固件。升级后重新启动。这可能有助于使其脱离暂停状态。”
我问他们在“初始化”状态下更新固件是否安全,以及他们是否确定在此状态下重新启动是否安全。他们从未回复那封电子邮件。
因为我谁也不信任,所以我备份了所有数据并重启了机器。结果又出现了两个坏盘。(它们是初始化 RAID1 阵列上的坏盘。)幸运的是,它们都在不同的 RAID1 阵列上,所以我可以更换坏盘。重启并重建阵列后,它们初始化了,现在一切都正常了。
因此,如果您发现此卡卡在“初始化”状态,我会备份数据,尝试重新启动,并祈祷坏磁盘位于不同的镜像上。
祝愿未来读到这篇文章的所有人都好运!