在一台旧的 HP SE316M1R2(与更常见的 ProLiant DL 160 G6 是同一台机器)上,我有一个 4x450GB Raid 5 阵列,由原装 P410 Smart Array 控制器处理,固件版本 8.40.30.00。驱动器是正品 10k SAS 450gb 2.5。
其中一个驱动器(托架 1)被标记为“预测故障”,因此我购买了一个备用驱动器。
第一次尝试是关机并移除旧驱动器,用新驱动器替换,然后开机。系统找不到启动驱动器。我已将损坏的驱动器放回第一个托架,服务器再次启动。
第二次尝试是将损坏的驱动器安装到位(托架 1),将新驱动器安装到托架 7。托架 7 中的驱动器被识别为 raid 0 一个驱动器健康阵列。我从逻辑驱动器中删除了它。在控制器的固件实用程序中,我无法找到任何方法将托架 1 驱动器标记为故障、将托架 7 驱动器设置为替换驱动器或将托架 7 驱动器设置为热备用驱动器。即使在从托架 7 驱动器中删除旧逻辑配置后重新启动也是如此。
然后,我进入 CLI 命令界面作为最后的手段,但我无法通过输入 help 来了解如何解决这个问题。似乎没有命令能够移除、添加或交换现有阵列中的驱动器。
我不敢相信我应该删除该卷并重新创建才能摆脱它。我肯定漏掉了一些东西,所以:
在这种情况下交换驱动器的最佳做法是什么?
注意:此机器安装了VMware ESXi 5.5。
编辑:我大概知道发生了什么。@ 第一次尝试时,新插入托架 1 的驱动器已经有了自己的逻辑驱动器配置。这就是阵列无法识别且系统无法启动的原因。@ 第二次尝试时,我擦除了它的配置。现在驱动器是空白的,如果我再次进行第一次尝试,控制器是否有可能从其他驱动器读取阵列配置并启动,然后开始后台阵列重建?当我能够为这台机器安排另一个维护窗口时,将再次更新。
答案1
在 SmartArray 控制器上,最简单的方法是在线热插拔驱动器,这将立即开始重建。您将能够使用 hpssacli/hpacucli 工具监控重建过程。
您可以在 ESXi 上安装这些工具,其可用形式为维布在 HPE 网站上。
请注意,RAID5 阵列在重建期间发现另一个故障驱动器并丢失数据是很常见的。希望您有备份。