从软件 RAID5 故障恢复中恢复

从软件 RAID5 故障恢复中恢复

;-) 我很荣幸被赋予这项任务,尝试从出现 RAID5 阵列问题且恢复尝试失败的服务器上获取数据。

背景:有问题的计算机是 IBM 的一台服务器,带有 6 端口 SATA2 背板。连接了四个相同的硬盘,每个硬盘容量为 1 TB,并配置为具有 4 个设备的 RAID5。过去,据报道,服务器偶尔会与一个或多个驱动器失去“联系”,RAID5 会关闭。重新启动服务器后,RAID5 会重新同步,一切都会好起来。维护这台服务器的人认为这是一个硬件问题。

几天前发生了灾难。起初,它看起来与以前一样,RAID5 由于某些驱动器处于离线状态而关闭。但重新启动并没有解决问题,相反,RAID5 被“破坏”了(不知道这是什么意思)。维护人员尝试使用 mdadm --create 重新创建 RAID5,他说它会将 RAID 显示为“正在恢复”(而不是重新同步!)。经过 5-6 小时的工作,这个过程完成了,RAID5 再次显示为活动状态。但是文件系统无法挂载(没有超级块)。

使用 testdisk 等数据恢复工具我们能够恢复文件,但它们似乎已损坏(尤其是在原始 WAV 文件中)。

这就是我接管的状态。我真的不知道出了什么问题,但我的猜测是,如果它不是在重启后立即损坏的,那么恢复会导致数据丢失。发出的命令序列也不可用。

我相信没有什么可以恢复的,但是在从头开始(并引入实际的备份策略,咳嗽)之前,我想与这里的专家核实一下。

答案1

希望您有备份,因为我非常怀疑您是否能恢复所有数据(如果有的话)。如果您没有备份,并且数据恢复是生死攸关的问题,您可以联系灾难恢复专家,他们可能会帮助您恢复数据。

答案2

几周前我也遇到过类似的事情。长话短说吧 :)
首先,服务器有时会看到硬盘,然后重启或关机后就看不到了。这是 raid 控制器的硬件问题,只需更换它即可。

我有一台装有 6 个 HDD 的 HP 服务器,其中一个磁盘出现故障,服务器无法识别新 HDD,在测试了另外 2 个新磁盘但没有成功后,我们决定关闭服务器并重新启动,然后 BOOM!另一个磁盘出现故障,磁盘阵列中的数据丢失。

经过几天寻找解决方案而无果后,我决定更换 raid 控制器,服务器确实识别了其中一个磁盘,我们重新上线。

当我在互联网上搜索解决方案时,我发现了这个网站:https://www.runtime.org/raid.htm
也许它可以解决你的问题,尝试可启动 CD

相关内容