发生故障的 Dell PowerEdge T410:将硬件 RAID PERC H700:3 x 300GB SAS(1 个故障)移至第二台 T410 进行磁盘克隆和启动

发生故障的 Dell PowerEdge T410:将硬件 RAID PERC H700:3 x 300GB SAS(1 个故障)移至第二台 T410 进行磁盘克隆和启动

发生故障的 Dell PowerEdge T410:将硬件 RAID PERC H700:3 x 300GB SAS(1 个故障)移至第二台 T410 进行磁盘克隆和启动

仅供参考——问题前的背景:

  • 我们几乎没有启动过原来的 T410,因为它显示 CMOS 电池错误,我们更换了两次电池。
  • 然后我想我们不妨稍后再回到这个 T410 并将数据和操作系统从其上移走。

基础设施场景

来源:

  • Dell T410 + 硬件 RAID PERC H700 控制器 - 6 个插槽/托架
  • 3 个 300 GB SAS 硬盘(H700 上的插槽 0 1 2)配置为 RAID 5
  • 557 GB“虚拟磁盘”卷(有 2 个分区 C 和 D)

    • Dell OMSA 工具测试和诊断报告 Drive 3 SMART 问题
  • 缺乏容易获得的 SAS 硬件

目的地:

  • 1 x 1 TB SATA 硬盘(H700 上的插槽 4)设置为 RAID 0,用于备份/克隆

目标与情景

  • 我们当前的目标是让它在其他 T410 Box 上启动并运行。

    • 我们关心的是如何确保它顺利运行直到我们可以从这个 RAID 中恢复或克隆它。

    • 使用软件 RAID 事情变得更简单,我们不确定 RAID 的哪些设置/配置是如何保存在 H700 内部的(如果有的话)。

  • 然后使用几个分区等恢复/克隆该卷,并找出另一种前进的方法。

要求:

想法/步骤以及我们应该做什么/不应该做什么,这些都是很好的意见

确保克隆的 1 x 1 TB 可启动

附言:我们服务的对象是一家亚洲小型中小企业非政府组织,因此资源有限。

答案1

您没有写任何有关非工作服务器上的故障类型的信息。我假设问题不是由于硬盘故障导致 RAID 损坏。显然,在这种情况下,将损坏的磁盘移至另一台服务器不会有什么帮助……

通常,RAID 配置由 H700(以及当今大多数其他 RAID 控制器)存储在磁盘上。这应该可以方便地在类似的控制器/服务器之间移动 RAID 集。

您只需将磁盘移至正在运行的服务器(尽管如此,我还是会确保将它们插入相同的插槽)。启动时,您必须进入 RAID BIOS。将出现一个菜单“导入外部配置”。

在正常情况下(即所有磁盘工作正常),控制器甚至应该自行检测到这一点:

当控制器固件检测到具有现有外部元数据的物理磁盘时,它会将该物理磁盘标记为外部磁盘,并生成警报,表明检测到外部磁盘。按F在此提示下导入配置(如果虚拟磁盘的所有成员驱动器都存在),而不加载 BIOS 配置实用程序。或者,按C进入 BIOS 配置实用程序并导入或清除外部配置。

来源:如何排除 Dell PowerEdge 服务器上的硬盘和 RAID 控制器错误

答案2

所采取的方法和解决步骤的总结:

  • 我们将 PERC 控制器和 3 个 SAS RAID 5 硬盘移至另一台 T410

    • 我们在启动时收到有关 RAID 数据的警告/错误消息,因此进入以确保配置/设置已通过

      • 另一个答案在这里:https://serverfault.com/a/756013/152268关于 RAID 控制器的说法很正确 - 但是,必须小心确保配置和磁盘能够继续使用,并且不会被错误更改
    • 另一个步骤是使用 Dell OSMA 磁盘,因为它可以进行彻底的分析,并清楚地了解 RAID

  • 我们使用 Paragon Hard Drive Manager - HDM Server 12 并从 RAID 5(插槽 0 1 2)克隆了 557GB“虚拟磁盘”卷(2 个分区 C 和 D)

    • 至:RAID 0 - 单个 1 TB SATA 硬盘(插槽 4)

    • 至:主板 SATA 端口上的单个 1 TB SATA 驱动器

  • 我们确实遇到了启动错误,我怀疑需要从 Windows 2008 可启动 CD/DVD 进行“启动修复”,但经过几次尝试,我们意识到存在一些硬盘问题。

    • 一旦这些问题得到解决,我们就得到了故障服务器的工作克隆

相关内容