RAID 无法重建 重建丢失的 HDD

RAID 无法重建 重建丢失的 HDD

首先我想说一下我的服务器的 RAID 配置。Intel RAID 10(4*1TB HDD)两个来自 wd,一个来自 hitachi,一个来自 seagate + 一个 seagate 作为热备 问题是最后一个 hdd seagate 出现故障,即使有一个热备也没有自动替换,然后我找到它并手动将热备替换到故障 HDD 的位置。然后打开它我发现它正在重建。后来它给出了一个错误消息“由于目标驱动器错误导致重建失败”然后我重新启动服务器,由于我留下了一些工作,我无法在 RAID 列表中找到替换的 hdd。今天我打开时从 BIOS 收到此错误消息,并且该 hdd 也添加到此列表中,日志为“如果您认为这些 PD 不包含所需的配置,请关闭系统电源,移除这些 PD 并重新启动。”时间戳只有 01,02,03。抱歉语言问题。

答案1

  1. 如果您的文件系统报告它们是完整的,并且数据没有损坏,那么您很幸运。立即进行完整备份!当您发现存储系统混乱、行为异常时,您应该首先这么做。

  2. 我不太清楚您使用的是哪种 RAID 技术。英特尔不生产 RAID 芯片,他们提供重新命名的 LSI MegaRAID 或“英特尔矩阵存储管理器”。前者很好,但出现您所描述的问题很奇怪。后者是假 RAID,众所周知,它非常不稳定且不可靠。我记得只有少数情况下它确实在重建后幸存下来,而很多情况下 IMSM RAID 帮助我们保存了数据,但却带来了更多麻烦。

对于后一种情况,我建议您不要修复当前设置,而是从 IMSM 迁移到真正的硬件 RAID 或完全软件定义的阵列。当驱动器转换为动态驱动器时,Windows 具有这种能力,而 Linux 软件 RAID 以其灵活性和可靠性而闻名。

  1. 如果您不想从假 RAID 迁移,我建议您尝试完全清除备用驱动器中的元数据,然后再次将它们用作备用驱动器。这应该会让系统的每个部分都忘记这些驱动器曾经在这里。您必须弹出备用驱动器,连接到其他计算机并在那里用零填充它(在 Linux 中,我使用 dd if=/dev/zero of=/dev/sdX;无法为 Windows 提出任何解决方案,请谷歌搜索),然后可以再次在阵列中尝试。

  2. 忽略关于不完全相同的驱动器的声明。所有冗余阵列 MTBF 计算都假设驱动器偶尔会独立损坏。如果您在相同负载下使用来自同一供应商的相同驱动器(这在新服务器中经常出现),它们将具有相同的制造特性和缺陷,并且驱动器故障的原因也将相同。因此,如果其中一个发生故障,您应该预料到其他驱动器也会很快发生故障,即不是独立故障。如果您使用类似的驱动器,通常的阵列可靠性假设是完全错误的!我见过一些系统,其中备用驱动器被启动,但在重建过程中其他驱动器损坏,因此阵列只会使数据检索更加困难,只是因为有人安装了完全相同的驱动器!

但是,如果您故意使用不同的驱动器,则可以假设这些驱动器不具有相同的特性和缺陷。它们将真正独立地发生故障。众所周知的阵列可靠性计算和预期只有在这种情况下才是正确的!因此,如果您想要真正的冗余,而不仅仅是货架上有数千个相同驱动器的迷人画面,那么您最终将始终使用不同的驱动器。并火烧死所有建议您使用“来自同一制造商和同一系列的相同驱动器”的人。

答案2

  1. 不幸的是,您的 RAID 不太可能重建。
  2. 您可以尝试移除备用磁盘,然后在重新启动一次后将其放回去。这可能会导致它重新访问并尝试重新读取。
  3. 强烈建议不要使用不相似的驱动器。事实上,我们(我的公司)甚至不会管理没有匹配驱动器(相同制造商、相同型号)的系统,因为不可恢复的崩溃可能性很高。

相关内容