RAID5 阵列已准备好重建

RAID5 阵列已准备好重建

我接手了一台带有 RAID 5 阵列的服务器的管理工作。阵列上有一个损坏的数据库,大小刚好超过分配大小的一半,因此无法恢复。
我最近将托架 25 中的备用磁盘更改为阵列的一部分(将为数据库恢复提供足够的空间),重建看起来开始正常。
但随后报告了托架 22 中的一个故障磁盘。该磁盘已被替换,现在我被困在服务器中,显示阵列配置状态为“RAID5,准备重建”。
有人能帮忙吗?

=> ctrl slot=1 show config

Smart Array P600 in Slot 1    (sn: P92B3AF9SXL040)

array A (SAS, Unused Space: 297996 MB)

  logicaldrive 1 (6.3 TB, RAID 5, Ready for Rebuild)

  physicaldrive 1E:1:1 (port 1E:box 1:bay 1, SAS, 300 GB, OK)
  physicaldrive 1E:1:2 (port 1E:box 1:bay 2, SAS, 300 GB, OK)
  physicaldrive 1E:1:3 (port 1E:box 1:bay 3, SAS, 300 GB, OK)
  physicaldrive 1E:1:4 (port 1E:box 1:bay 4, SAS, 300 GB, OK)
  physicaldrive 1E:1:5 (port 1E:box 1:bay 5, SAS, 300 GB, OK)
  physicaldrive 1E:1:6 (port 1E:box 1:bay 6, SAS, 300 GB, OK)
  physicaldrive 1E:1:7 (port 1E:box 1:bay 7, SAS, 300 GB, OK)
  physicaldrive 1E:1:8 (port 1E:box 1:bay 8, SAS, 300 GB, OK)
  physicaldrive 1E:1:9 (port 1E:box 1:bay 9, SAS, 300 GB, OK)
  physicaldrive 1E:1:10 (port 1E:box 1:bay 10, SAS, 300 GB, OK)
  physicaldrive 1E:1:11 (port 1E:box 1:bay 11, SAS, 300 GB, OK)
  physicaldrive 1E:1:12 (port 1E:box 1:bay 12, SAS, 300 GB, OK)
  physicaldrive 1E:1:13 (port 1E:box 1:bay 13, SAS, 300 GB, OK)
  physicaldrive 1E:1:14 (port 1E:box 1:bay 14, SAS, 300 GB, OK)
  physicaldrive 1E:1:15 (port 1E:box 1:bay 15, SAS, 300 GB, OK)
  physicaldrive 1E:1:16 (port 1E:box 1:bay 16, SAS, 300 GB, OK)
  physicaldrive 1E:1:17 (port 1E:box 1:bay 17, SAS, 300 GB, OK)
  physicaldrive 1E:1:18 (port 1E:box 1:bay 18, SAS, 300 GB, OK)
  physicaldrive 1E:1:19 (port 1E:box 1:bay 19, SAS, 300 GB, OK)
  physicaldrive 1E:1:20 (port 1E:box 1:bay 20, SAS, 300 GB, OK)
  physicaldrive 1E:1:21 (port 1E:box 1:bay 21, SAS, 300 GB, OK)
  physicaldrive 1E:1:22 (port 1E:box 1:bay 22, SAS, 300 GB, OK)
  physicaldrive 1E:1:23 (port 1E:box 1:bay 23, SAS, 300 GB, OK)
  physicaldrive 1E:1:24 (port 1E:box 1:bay 24, SAS, 300 GB, OK)
  physicaldrive 1E:1:25 (port 1E:box 1:bay 25, SAS, 300 GB, OK)

答案1

这有点疯狂......智能阵列 P600 PCI-X RAID 控制器(大约 2005 年)?!?25 个磁盘?RAID 5?这是HP MSA70 机箱? 可能不是HP D2700


“准备重建”是您在 HP ProLiant 系统上可能收到的最差的阵列状态消息。这表明逻辑驱动器无法完成重建,因为无法从合作伙伴或从属驱动器读取数据。通常这意味着您有一个故障磁盘和一个故障磁盘。这也称为不可恢复的读取错误 (URE)。

请参阅以下内容:

RAID 1 故障“状态准备重建:重建完成百分比 0%”

HP Proliant ML350 G5 SAS 硬盘

强制重建 HP 智能阵列中的 LUN

RAID5 中 24 个磁盘很愚蠢。这不是你的错。但 25 个磁盘才是。对于 RAID5 来说,驱动器太多了,即使你拥有 10k RPM 企业磁盘。为了增加 300GB 的空间而失去备用磁盘是一个糟糕的举动,因为 I/O 和时间扩展如此大的磁盘组会产生巨大影响。它会触及所有磁盘,并且会占用非常时间太长。风险和暴露太大。

你可能会遇到控制器固件问题或配置限制。该控制器的固件最后一次发布是在 2009 年。旧设备加上像您这样的非常不正常的配置是需要一些工作才能修复的极端情况。这也可能是外壳的问题。

  • 您有好的备份吗?
  • 您是否能够将所有组件的固件更新至最新版本?
  • 您能否对这里的所有设备进行电源循环并仔细观察系统 POST 消息以读取 RAID 控制器输出?
  • 假设没有真实的驱动器上出现读取错误。

因此,这违反直觉,但关闭电源、等待并打开电源可能是您最好的选择。
这也可能是最糟糕的选择,所以希望您有备份。 :(

答案2

我知道这是一篇旧帖子,但可能对其他人有帮助。当我更换磁盘时,我的 P410i 大部分时间都会发生这种情况。新磁盘初始化,然后显示“准备重建”,但什么也没发生。当它发生这种情况时,我拔掉了我刚更换的磁盘的电源,它不会重建。等待 10-15 秒,然后重新插入,然后开始重建。我正在运行一个有 8 个磁盘的 Raid 50 - 我想它已经使用了 6 年,并且随着时间的推移有 3 个磁盘出现故障 - 但重建了 6 次,因为我用临时磁盘替换了它,直到我得到了正确的备用磁盘。

相关内容