Raid 5 scsi 故障

Raid 5 scsi 故障

我对服务器了解不多,整天都在互联网上寻找解决 raid 5 问题的方法。突然,两个磁盘出现故障。服务器无法启动(HP Proliant、Windows 2003 R2,非常老旧,可能有 10 年历史)。我知道如果一个磁盘出现故障,那么我可以添加一个新磁盘并重建它,一切都会好起来,问题是两个磁盘出现故障 :( 这是正常的吗?两个同时出现故障?除了取出并重新插入,还有其他我可以做但我不知道的事情吗?Windows 无法启动。阵列菜单显示磁盘 0 和 4“丢失”。还有其他技巧或事情要做吗?这很重要,因为出于某种未知原因,备份工作一个月都没有工作,我刚刚才发现,所以我需要让这些 raid 5 重新上线。

答案1

可能如果只是 raid 软件使磁盘脱机,则可以强制磁盘恢复到联机状态,这可能允许您重建阵列。

然而,如果两个磁盘确实有故障,那么您基本上就完蛋了。(除了使用昂贵的数据恢复公司)

答案2

你需要做一个叫做“重新标记”的过程,它可能工作。基本上,这个想法如下:

  • 查找首先发生故障的磁盘
  • 重新创建包含所有磁盘的阵列
  • 手动强制第一个磁盘脱机

这样你应该会得到一个性能下降但可用的 raid 阵列,你可以向其中添加一个新磁盘,或者用旧磁盘重建(如果它发生了 scsi 超时软故障)。

找到哪个磁盘首先出现故障很容易 - 您需要进入控制器日志。

答案3

作为季亚斯尼写入:首先找到发生故障的驱动器;将其移除(断开 SATA 电缆);尝试使用其他驱动器重建阵列(mdadm --assemble /dev/md0 /dev/sd[b-d]1 --force)。

我强烈建议在开始重建之前对所有驱动器进行逐位复制(例如dd。如果您选错了驱动器,您可以移除其他驱动器重试。同时标记它们连接到控制器的哪个端口。更改此顺序不是个好主意。

这里有很好的描述https://raid.wiki.kernel.org/index.php/RAID_Recovery 开始之前请先阅读它。

相关内容