发生故障的 Dell PowerEdge T410:将硬件 RAID PERC H700:3 x 300GB SAS(1 个故障)移至第二台 T410 进行磁盘克隆和启动
仅供参考——问题前的背景:
- 我们几乎没有启动过原来的 T410,因为它显示 CMOS 电池错误,我们更换了两次电池。
- 然后我想我们不妨稍后再回到这个 T410 并将数据和操作系统从其上移走。
基础设施场景
来源:
- Dell T410 + 硬件 RAID PERC H700 控制器 - 6 个插槽/托架
- 3 个 300 GB SAS 硬盘(H700 上的插槽 0 1 2)配置为 RAID 5
557 GB“虚拟磁盘”卷(有 2 个分区 C 和 D)
- Dell OMSA 工具测试和诊断报告 Drive 3 SMART 问题
- 缺乏容易获得的 SAS 硬件
目的地:
- 1 x 1 TB SATA 硬盘(H700 上的插槽 4)设置为 RAID 0,用于备份/克隆
目标与情景
我们当前的目标是让它在其他 T410 Box 上启动并运行。
我们关心的是如何确保它顺利运行直到我们可以从这个 RAID 中恢复或克隆它。
使用软件 RAID 事情变得更简单,我们不确定 RAID 的哪些设置/配置是如何保存在 H700 内部的(如果有的话)。
然后使用几个分区等恢复/克隆该卷,并找出另一种前进的方法。
要求:
想法/步骤以及我们应该做什么/不应该做什么,这些都是很好的意见
确保克隆的 1 x 1 TB 可启动
相似的东西:http://en.community.dell.com/support-forums/servers/f/956/t/19497545
- 主板上的启动顺序与 RAID 启动
- RAID H700 有变化吗?
- 1 TB SATA 有修复吗?
附言:我们服务的对象是一家亚洲小型中小企业非政府组织,因此资源有限。
答案1
您没有写任何有关非工作服务器上的故障类型的信息。我假设问题不是由于硬盘故障导致 RAID 损坏。显然,在这种情况下,将损坏的磁盘移至另一台服务器不会有什么帮助……
通常,RAID 配置由 H700(以及当今大多数其他 RAID 控制器)存储在磁盘上。这应该可以方便地在类似的控制器/服务器之间移动 RAID 集。
您只需将磁盘移至正在运行的服务器(尽管如此,我还是会确保将它们插入相同的插槽)。启动时,您必须进入 RAID BIOS。将出现一个菜单“导入外部配置”。
在正常情况下(即所有磁盘工作正常),控制器甚至应该自行检测到这一点:
当控制器固件检测到具有现有外部元数据的物理磁盘时,它会将该物理磁盘标记为外部磁盘,并生成警报,表明检测到外部磁盘。按F在此提示下导入配置(如果虚拟磁盘的所有成员驱动器都存在),而不加载 BIOS 配置实用程序。或者,按C进入 BIOS 配置实用程序并导入或清除外部配置。
答案2
所采取的方法和解决步骤的总结:
我们将 PERC 控制器和 3 个 SAS RAID 5 硬盘移至另一台 T410
我们在启动时收到有关 RAID 数据的警告/错误消息,因此进入以确保配置/设置已通过
- 另一个答案在这里:https://serverfault.com/a/756013/152268关于 RAID 控制器的说法很正确 - 但是,必须小心确保配置和磁盘能够继续使用,并且不会被错误更改
另一个步骤是使用 Dell OSMA 磁盘,因为它可以进行彻底的分析,并清楚地了解 RAID
我们使用 Paragon Hard Drive Manager - HDM Server 12 并从 RAID 5(插槽 0 1 2)克隆了 557GB“虚拟磁盘”卷(2 个分区 C 和 D)
至:RAID 0 - 单个 1 TB SATA 硬盘(插槽 4)
至:主板 SATA 端口上的单个 1 TB SATA 驱动器
我们确实遇到了启动错误,我怀疑需要从 Windows 2008 可启动 CD/DVD 进行“启动修复”,但经过几次尝试,我们意识到存在一些硬盘问题。
- 一旦这些问题得到解决,我们就得到了故障服务器的工作克隆