HP SmartArray P400:如何修复故障的逻辑驱动器?

HP SmartArray P400:如何修复故障的逻辑驱动器?

我有一台配备 SmartArray P400 控制器(包含 256 MB 缓存/电池备份)的 HP 服务器,该服务器的逻辑驱动器已更换,但出现故障的物理驱动器无法重建。

当我检测到错误时,它看起来是这样的:

~# /usr/sbin/hpacucli ctrl slot=0 显示配置
插槽 0 中的智能阵列 P400(嵌入式)(序列号:XXXX)

  阵列 A(SATA,未使用空间:0 MB)
    逻辑驱动器 1(698.6 GB,RAID 1,正常)
      物理驱动器 1I:1:1(端口 1I:盒 1:托架 1,SATA,750 GB,正常)
      物理驱动器 1I:1:2(端口 1I:盒 1:托架 2,SATA,750 GB,正常)

  阵列 B(SATA,未使用空间:0 MB)
    逻辑驱动器 2(2.7 TB,RAID 5,发生故障)
      物理驱动器 1I:1:3(端口 1I:盒 1:托架 3,SATA,750 GB,正常)
      物理驱动器 1I:1:4(端口 1I:盒 1:托架 4,SATA,750 GB,正常)
      物理驱动器 2I:1:5(端口 2I:盒 1:托架 5,SATA,750 GB,正常)
      物理驱动器 2I:1:6(端口 2I:盒 1:托架 6,SATA,750 GB,发生故障)
      物理驱动器 2I:1:7(端口 2I:盒 1:托架 7,SATA,750 GB,正常)

  未分配
      物理驱动器 2I:1:8(端口 2I:盒 1:托架 8,SATA,750 GB,正常)
~#

我以为我已将驱动器 2I:1:8 配置为阵列 A 和阵列 B 的备用驱动器,但事实似乎并非如此 :-(。我注意到该问题是由于主机上的 I/O 错误引起的,即使 RAID5 中只有 1 个物理驱动器发生故障。

有人知道为什么会发生这种情况吗?逻辑驱动器应该进入“降级”模式,但仍然可以从主机操作系统完全访问!?

我首先尝试将未分配的驱动器 2I:1:8 作为备用驱动器添加到逻辑驱动器 2,但这是不可能的:

~# /usr/sbin/hpacucli ctrl slot=0 阵列 B 添加备件=2I:1:8
    错误:当前配置不支持此操作。
    使用设备上的“显示”命令来显示更多详细信息
    关于配置。
~#  

有趣的是,可以将未分配的驱动器添加到第一个阵列而不会出现问题。我想也许控制器由于缺少备用驱动器而将阵列置于“故障”状态,并保护故障阵列免受修改。所以我尝试重新启用逻辑驱动器(之后添加备用驱动器):

~# /usr/sbin/hpacucli ctrl slot=0 ld 2 修改重新启用
    警告:逻辑驱动器上任何先前存在的数据可能无法
    有效或可恢复。继续吗?(y/n) y

    错误:当前配置不支持此操作。
    使用设备上的“显示”命令来显示更多详细信息
    关于配置。
~#

但正如您所看到的,重新启用逻辑驱动器是不可能的。

现在我通过热交换未分配的驱动器来替换故障驱动器。现在的状态如下:

~# /usr/sbin/hpacucli ctrl slot=0 显示配置
插槽 0 中的智能阵列 P400(嵌入式)(序列号:XXXX)

  阵列 A(SATA,未使用空间:0 MB)
    逻辑驱动器 1(698.6 GB,RAID 1,正常)
      物理驱动器 1I:1:1(端口 1I:盒 1:托架 1,SATA,750 GB,正常)
      物理驱动器 1I:1:2(端口 1I:盒 1:托架 2,SATA,750 GB,正常)

  阵列 B(SATA,未使用空间:0 MB)
    逻辑驱动器 2(2.7 TB,RAID 5,发生故障)
      物理驱动器 1I:1:3(端口 1I:盒 1:托架 3,SATA,750 GB,正常)
      物理驱动器 1I:1:4(端口 1I:盒 1:托架 4,SATA,750 GB,正常)
      物理驱动器 2I:1:5(端口 2I:盒 1:托架 5,SATA,750 GB,正常)
      物理驱动器 2I:1:6(端口 2I:盒 1:托架 6,SATA,750 GB,正常)
      物理驱动器 2I:1:7(端口 2I:盒 1:托架 7,SATA,750 GB,正常)
~#

逻辑驱动器仍然无法访问。为什么不重建?

我能做些什么?

仅供参考,这是我的控制器的配置:

~# /usr/sbin/hpacucli ctrl slot=0 显示
 插槽 0 中的智能阵列 P400(嵌入式)
  总线接口:PCI
  槽位:0
  序列号:XXXX
  缓存序列号:XXXX
  RAID 6 (ADG) 状态:已启用
  控制器状态:正常
  底盘插槽:
  硬件版本:版本 E
  固件版本:5.22
  重建优先级:中
  展开优先级:中
  表面扫描延迟:15 秒
  表面分析不一致通知:已禁用
  Raid1 写缓冲:已禁用
  提示后超时:0 秒
  缓存板存在:是
  缓存状态:正常
  加速器比率:25%读取/75%写入
  驱动器写入缓存:已禁用
  总缓存大小:256 MB
  无电池写入缓存:已禁用
  缓存备用电源:电池
  电池/电容器数量:1
  电池/电容器状态:正常
  支持 SATA NCQ:是
~#

提前感谢您的帮助。

答案1

答案并不令人愉快。您的阵列很可能处于“等待重建”状态,而另一个失败RAID5 阵列集中的磁盘阻止了恢复完成。这就是为什么你现在应该避免使用 RAID5。这些是 SATA 驱动器,这无济于事……出现问题的可能性更高。尝试关闭系统电源(让驱动器旋转)并重新打开电源。按照 BIOS 阵列屏幕上的提示进行操作,然后选择F2“重新启用所有逻辑驱动器”选项。这可能会启动重建过程。

否则,将使用新磁盘进行重建/恢复。

答案2

您应该启动 ACU 并查看到底发生了什么。如果整个逻辑驱动器无法访问,您可以在其中重新启用它。

相关内容