如何避免因磁盘坏道而导致数据丢失？

Question 1

鉴于你假设数据存储最终总会失败，你只需要保留多份副本数据，并偶尔检查并确保您可以成功读取数据。

使用某种类型的 RAID 听起来像是至少拥有一份备份的好方法，但额外的副本也是一个好主意，至少出于显而易见的原因，不必将所有副本都放在同一栋建筑、房间和机器中。在线备份是一种让其他人担心其驱动器故障的好方法。

为了确保数据仍然可读，只需保留自己的校验和并定期验证即可。基本的 CRC 就可以了，例如cksumGNU 的核心实用程序，甚至是 md5sum 或 shaXsum（尽管在我看来，它们对于坏扇区来说有点过头了）。

_{[并且保留校验和文件的几个副本，原因很明显。]}

即使 ZFS 有自己的校验和，您仍应保留自己的副本，以验证存储在其他文件系统或在线的副本。我假设您或 ZFS 无论如何都必须读取所有文件以进行验证（我相信这被称为ZFS 数据清理，用明确调用zpool scrub）。

有趣的是，许多驱动器（尤其是闪存驱动器）会自行进行坏块管理（和磨损均衡），将坏块和边缘块换成新的备用块，所有操作（大部分）都是悄无声息地进行，您或操作系统甚至都不会注意到。我曾经读过有关闪存卡的文章，16GB 内存中只有足够好的内存来制作 512MB 或 1G 的卡。

Answer

鉴于你假设数据存储最终总会失败，你只需要保留多份副本数据，并偶尔检查并确保您可以成功读取数据。

使用某种类型的 RAID 听起来像是至少拥有一份备份的好方法，但额外的副本也是一个好主意，至少出于显而易见的原因，不必将所有副本都放在同一栋建筑、房间和机器中。在线备份是一种让其他人担心其驱动器故障的好方法。

为了确保数据仍然可读，只需保留自己的校验和并定期验证即可。基本的 CRC 就可以了，例如cksumGNU 的核心实用程序，甚至是 md5sum 或 shaXsum（尽管在我看来，它们对于坏扇区来说有点过头了）。

_{[并且保留校验和文件的几个副本，原因很明显。]}

即使 ZFS 有自己的校验和，您仍应保留自己的副本，以验证存储在其他文件系统或在线的副本。我假设您或 ZFS 无论如何都必须读取所有文件以进行验证（我相信这被称为ZFS 数据清理，用明确调用zpool scrub）。

有趣的是，许多驱动器（尤其是闪存驱动器）会自行进行坏块管理（和磨损均衡），将坏块和边缘块换成新的备用块，所有操作（大部分）都是悄无声息地进行，您或操作系统甚至都不会注意到。我曾经读过有关闪存卡的文章，16GB 内存中只有足够好的内存来制作 512MB 或 1G 的卡。

Question 2

关于 RAID 5/6

RAID 5/6 具有奇偶校验数据。

如果它可以重建整个磁盘，那么肯定有足够的奇偶校验数据来恢复单个扇区。

最糟糕的情况是，您检测到坏扇区并替换整个驱动器，现在一切都已重建。

因此，如果 RAID 5/6 检测到坏扇区，则应该自动使用奇偶校验数据进行修复。

我的 Adaptec RAID 控制器甚至在 GUI 中有一个特殊的“验证/修复”选项。

另请注意校验和、sha1、sha2、CRC 等仅提供检测错误发生时间的功能。它不提供修复错误的能力。

Answer