10TB ext3 RAID 6 的 fsck 存在重大问题（内存分配失败等）

Question 1

只需重建阵列并从备份中恢复数据即可。RAID 的重点是尽量减少停机时间。通过乱搞并尝试修复此类问题，您只会增加停机时间，从而违背 RAID 的整个目的。RAID 不能防止数据丢失，而是防止停机。

Answer

只需重建阵列并从备份中恢复数据即可。RAID 的重点是尽量减少停机时间。通过乱搞并尝试修复此类问题，您只会增加停机时间，从而违背 RAID 的整个目的。RAID 不能防止数据丢失，而是防止停机。

Question 2

fsck经过更多尝试后，我发现了一些补救措施：

防止出现“内存分配失败”错误

fsck似乎存在内存泄漏的重大问题。如果它在存在某些问题（真实或虚构）的文件系统上运行，它将逐个“修复”这些问题（请参阅原始问题中的屏幕转储）。在这样做的过程中，它会消耗越来越多的内存（也许会保留更改日志？）。几乎没有限制。但是，fsck可以随时取消（Ctrl-C）并重新启动。在这种情况下，它将从中断的地方继续，但其内存使用量将重置为几乎为零（暂时）。

考虑到这一点，需要做三件事：

使用 64 位 Linux（似乎对如何fsck使用可用内存有所区别）
添加一个超大的交换分区（我用了 256GB，fsck运行了大约 12 个小时）
频繁中止并重新启动 fsck（频率取决于交换分区的大小）

注意：我不知道取消并重新启动是否fsck会带来任何其他危险（可能会），但它似乎对我有用。

如果发生“内存分配失败”错误，处理由此造成的损害（重要！）

fsck以最糟糕的方式处理Memory allocation failed错误：破坏完好无损的数据。我不确定为什么，但我的猜测是它将一些保存在内存中的内容最终写入磁盘，而这些内容（由于错误）同时被损坏了。

就我而言，最明显的问题是，当我fsck在错误发生后重新启动时，它有时会报告损坏的超级块。问题是：我不知道如何超级块损坏了，尤其是在没有报告损坏的情况下。也许，如果在错误发生后重新启动，它会使用损坏的超级块中发现的不正确的驱动器元数据进行所有进一步的检查，最终修复实际上不存在的“问题”，从而破坏过程中的好数据。

因此，如果fsck 曾经因错误而死机Memory allocation failed，需要使用-b参数重新启动，以使用（希望）未因错误而损坏的备份超级块。可以使用找到备份超级块的位置mke2fs -n /dev/...。

因为我不知道如果fsck在选择了备份超级块的情况下死机会发生什么，所以我通常fsdk在到达时立即中止Pass 1: Checking inodes, blocks, and sizes，然后重新启动它-b，此时它会启动而不会抱怨超级块损坏。也就是说，它似乎做的第一件事fsck -b就是恢复主超级块。

现在我们一直在等待的是：

如何在不让 fsck 运行完成的情况下挂载文件系统

这是我偶然发现的：事实证明，在运行fsck -b并中止它之后，一旦它打印Pass 1: Checking inodes, blocks, and sizes（在发现任何错误之前），文件系统就会处于可安装状态（耶！我几乎恢复了所有数据！）。

（注意：可能还有其他使用方法mount -o force，但就我的情况而言不需要。）

如何避免所有这些问题

似乎有两种方法：

使用 ext3，但要保留最新的备份。然后，经常fsck使用参数运行-N。如果显示任何问题，删除整个 fs 并从备份中恢复所有内容。由于在这种情况下，人们会非常依赖备份，因此我建议保留备份的备份。此外，使用复制工具，以某种方式确保恢复过程中不会产生随机错误（处理 TB 级数据时，一万亿次读写操作的 MTBF 很小）。确保也为由此产生的停机时间做好计划，因为多 TB 恢复可能需要一段时间……
我的建议：不要使用 ext3！fs-design 和相关工具（此处fsck）还不够强大，无法用于实际生产（目前还不够？）。fsck处理内存错误的方式以及首先发生错误的事实在我看来是不可接受的。从现在开始我将尝试 xfs，但还没有足够的经验来判断它是否更好。

Answer