我在 Rocky Linux 8 上有一个刀片服务器,上面有 5 个 18TB WD Gold HDD,使用 mdadm 构建了一个软件 RAID0。如果你们能帮忙,我会接受所有关于这方面的讲座并改变我的方式。当我正在调查一个看似空的 HD 插槽(LED 熄灭)时,我需要喝咖啡,我弹出了 RAID 中的一个驱动器。我迅速将其放回原位并重新启动……发现我正在启动到紧急模式。
/var/log/messages 文件表明 RAID 上的 NTFS 文件系统不可用,并且系统无法打开 RAID 组件 /dev/sde。检查 fdisk 还报告备份 GPT 表不在 dev/sdf 的末尾。
cat /proc/mdstat 的输出显示以下配置。我记得我已安装 md126 和 md127。但是,md127 显示状态为 inactive。 猫/proc/mdstat
当我使用 mdadm 检查 /dev/md127 时,它给出以下输出: mdadm --检查 /dev/md127
我没有采取任何措施来解决这个问题,因为我想先了解发生了什么。我担心丢失数据,但担心程度不足以支付数据恢复费用。我对 RAID 尤其是软件 RAID 了解不够,无法自信地采取行动。那么这有多严重,最安全的方法是什么?
编辑:我看到此帖子的标题已被用户从“RAID 0 阵列中的 HDD 暂时断开连接”编辑为“RAID 0 阵列已损坏”。RAID 肯定已损坏吗?任何见解都将不胜感激。
答案1
好吧,这个故事有一个美好的结局!
使用 ddrescue 复制所有 18Tb 磁盘后,我在 /dev/md0 上使用 ntfs 等效的 fsck (ntfsfix)。该实用程序能够恢复文件系统,并且所有数据都已恢复。
在这篇文章发表后的几个小时内,一位版主将标题从“RAID 0 阵列中的硬盘暂时断开连接”改为“RAID 0 阵列已损坏且无备份”。事实证明,事实并非如此。我现在已恢复了文章的原始标题。