我有一台配备 SmartArray P400 控制器(包含 256 MB 缓存/电池备份)的 HP 服务器,该服务器的逻辑驱动器已更换,但出现故障的物理驱动器无法重建。
当我检测到错误时,它看起来是这样的:
~# /usr/sbin/hpacucli ctrl slot=0 显示配置 插槽 0 中的智能阵列 P400(嵌入式)(序列号:XXXX) 阵列 A(SATA,未使用空间:0 MB) 逻辑驱动器 1(698.6 GB,RAID 1,正常) 物理驱动器 1I:1:1(端口 1I:盒 1:托架 1,SATA,750 GB,正常) 物理驱动器 1I:1:2(端口 1I:盒 1:托架 2,SATA,750 GB,正常) 阵列 B(SATA,未使用空间:0 MB) 逻辑驱动器 2(2.7 TB,RAID 5,发生故障) 物理驱动器 1I:1:3(端口 1I:盒 1:托架 3,SATA,750 GB,正常) 物理驱动器 1I:1:4(端口 1I:盒 1:托架 4,SATA,750 GB,正常) 物理驱动器 2I:1:5(端口 2I:盒 1:托架 5,SATA,750 GB,正常) 物理驱动器 2I:1:6(端口 2I:盒 1:托架 6,SATA,750 GB,发生故障) 物理驱动器 2I:1:7(端口 2I:盒 1:托架 7,SATA,750 GB,正常) 未分配 物理驱动器 2I:1:8(端口 2I:盒 1:托架 8,SATA,750 GB,正常) ~#
我以为我已将驱动器 2I:1:8 配置为阵列 A 和阵列 B 的备用驱动器,但事实似乎并非如此 :-(。我注意到该问题是由于主机上的 I/O 错误引起的,即使 RAID5 中只有 1 个物理驱动器发生故障。
有人知道为什么会发生这种情况吗?逻辑驱动器应该进入“降级”模式,但仍然可以从主机操作系统完全访问!?
我首先尝试将未分配的驱动器 2I:1:8 作为备用驱动器添加到逻辑驱动器 2,但这是不可能的:
~# /usr/sbin/hpacucli ctrl slot=0 阵列 B 添加备件=2I:1:8 错误:当前配置不支持此操作。 使用设备上的“显示”命令来显示更多详细信息 关于配置。 ~#
有趣的是,可以将未分配的驱动器添加到第一个阵列而不会出现问题。我想也许控制器由于缺少备用驱动器而将阵列置于“故障”状态,并保护故障阵列免受修改。所以我尝试重新启用逻辑驱动器(之后添加备用驱动器):
~# /usr/sbin/hpacucli ctrl slot=0 ld 2 修改重新启用 警告:逻辑驱动器上任何先前存在的数据可能无法 有效或可恢复。继续吗?(y/n) y 错误:当前配置不支持此操作。 使用设备上的“显示”命令来显示更多详细信息 关于配置。 ~#
但正如您所看到的,重新启用逻辑驱动器是不可能的。
现在我通过热交换未分配的驱动器来替换故障驱动器。现在的状态如下:
~# /usr/sbin/hpacucli ctrl slot=0 显示配置 插槽 0 中的智能阵列 P400(嵌入式)(序列号:XXXX) 阵列 A(SATA,未使用空间:0 MB) 逻辑驱动器 1(698.6 GB,RAID 1,正常) 物理驱动器 1I:1:1(端口 1I:盒 1:托架 1,SATA,750 GB,正常) 物理驱动器 1I:1:2(端口 1I:盒 1:托架 2,SATA,750 GB,正常) 阵列 B(SATA,未使用空间:0 MB) 逻辑驱动器 2(2.7 TB,RAID 5,发生故障) 物理驱动器 1I:1:3(端口 1I:盒 1:托架 3,SATA,750 GB,正常) 物理驱动器 1I:1:4(端口 1I:盒 1:托架 4,SATA,750 GB,正常) 物理驱动器 2I:1:5(端口 2I:盒 1:托架 5,SATA,750 GB,正常) 物理驱动器 2I:1:6(端口 2I:盒 1:托架 6,SATA,750 GB,正常) 物理驱动器 2I:1:7(端口 2I:盒 1:托架 7,SATA,750 GB,正常) ~#
逻辑驱动器仍然无法访问。为什么不重建?
我能做些什么?
仅供参考,这是我的控制器的配置:
~# /usr/sbin/hpacucli ctrl slot=0 显示 插槽 0 中的智能阵列 P400(嵌入式) 总线接口:PCI 槽位:0 序列号:XXXX 缓存序列号:XXXX RAID 6 (ADG) 状态:已启用 控制器状态:正常 底盘插槽: 硬件版本:版本 E 固件版本:5.22 重建优先级:中 展开优先级:中 表面扫描延迟:15 秒 表面分析不一致通知:已禁用 Raid1 写缓冲:已禁用 提示后超时:0 秒 缓存板存在:是 缓存状态:正常 加速器比率:25%读取/75%写入 驱动器写入缓存:已禁用 总缓存大小:256 MB 无电池写入缓存:已禁用 缓存备用电源:电池 电池/电容器数量:1 电池/电容器状态:正常 支持 SATA NCQ:是 ~#
提前感谢您的帮助。
答案1
答案并不令人愉快。您的阵列很可能处于“等待重建”状态,而另一个失败RAID5 阵列集中的磁盘阻止了恢复完成。这就是为什么你现在应该避免使用 RAID5。这些是 SATA 驱动器,这无济于事……出现问题的可能性更高。尝试关闭系统电源(让驱动器旋转)并重新打开电源。按照 BIOS 阵列屏幕上的提示进行操作,然后选择F2
“重新启用所有逻辑驱动器”选项。这可能会启动重建过程。
否则,将使用新磁盘进行重建/恢复。
答案2
您应该启动 ACU 并查看到底发生了什么。如果整个逻辑驱动器无法访问,您可以在其中重新启用它。