Debian/3ware 9500 - RAID 故障?

Debian/3ware 9500 - RAID 故障?

昨晚我将家用服务器的硬盘换到新机箱中(新主板/CPU/RAM),并将其 3ware 9500 PCI-X SATA RAID 卡一起转移。该机器有 4 个磁盘配置在 2 个 RAID1 中 - 根 (500GB) 和介质 (1TB)。它运行 Debian 7 32 位。
机器启动正常,但只有在运行并且 3ware 实用程序已加载时,我才注意到阵列中缺少一个根磁盘。我关闭它并摇晃磁盘(我知道这个磁盘不稳定,我需要买一个新的),最终让 RAID 卡看到它。这意味着启动 RAID 重建,所以我让机器重新启动到 Debian,这样我就可以关注它的进度并让重建开始。
在我不得不去做其他事情之前,它运行得很好,达到 90% 的范围。当我回来时,灾难发生了 - RAID 卡显示没有 RAID 或磁盘。 Debian 仍在运行(不知何故!)但我什么也做不了。媒体卷不见了,根文件系统似乎完全损坏了 - bash 将系统二进制文件解释为随机数字字符串。除了重新启动之外没有别的办法了(而且必须硬重启,关机命令不起作用)。RAID
卡详细说明了所有 4 个磁盘都存在,但问题磁盘仍未使用,这意味着仍然需要手动重建 RAID。当 Grub 启动时,它声明它无法识别我的两个 RAID 上的文件系统,因此给了我恢复 shell - 我不知道如何使用它(我的互联网昨晚也断了),所以我不知道我的磁盘处于什么状态。我删除了好的根磁盘,并尝试在不稳定的磁盘上以降级模式启动系统,以查看其上是否有任何可用数据,但 RAID 卡拒绝让我将其用作启动介质。
如果有必要,我有一个 USB-SATA 适配器,但目前我不知道恢复系统的可能性有多大;我知道 RAID 不能替代备份,但这些磁盘上有大量数据,需要很长时间才能重建(也就是说,它们不是不可替代的,但我不想擦除系统并重新开始)。有什么想法我可以从哪里开始?

编辑:取得了一些进展。看起来根对中的“好”磁盘在重建过程中遭遇了硬件故障!我尝试将其 dd 到新磁盘并出现 IO 错误,而 SpinRite 不想碰它。“坏”磁盘处于某种不确定状态,但其中一个分区通过了 fsck 并安装在活动磁盘中,因此我将其 dd 到备用磁盘。它无法解释为什么其他两个媒体磁盘消失了,但挽救 /home 分区是一个很好的开始。

编辑 2:这里发生了一些非常奇怪的事情。这两个媒体磁盘不会出现在我的台式机的 BIOS 中,并且通过我的笔记本电脑上的 USB,它们都显示没有分区表。我开始怀疑这四个磁盘中的三个是否不知何故同时坏了,或者它们是否被新硬件损坏了 - 如果是这样,我不知道为什么,电涌是我唯一能想到的,但这应该首先烧坏主板!

编辑 3:进一步回答我的最后一条评论,未检测到磁盘的问题显然是由于 3ware 卡使用它们的方式造成的;媒体磁盘在 3ware 控制器上显示正常,其分区表完好无损。现在对它们进行 fsck,祈祷我可以获取数据...

编辑 4:我能够从媒体磁盘中挽救所有内容,尽管在安装之前我必须对分区运行广泛的 fsck。存在许多错误,包括不匹配或无效的 inode 和可用空间计数。奇怪的是,当时实际上不应该有任何东西使用磁盘。好的,Plex Media Server 正在运行,但由于我没有触碰驱动器上的任何媒体,所以我认为这不会在 RAID 发生故障时扰乱文件系统的状态。我将尝试进入有效的根磁盘,看看日志说了什么。在确定导致 RAID 消失的原因之前,我将回到软件 RAID。

答案1

我的数据仍在磁盘上。我不知道是什么毁了它们,但我现在对硬件控制器很警惕。我使用软件 RAID 重建了机器,并将所有挽救的数据放回原位。如果其他人遇到这个问题,我不知道从哪里开始。

相关内容