据我了解,由于必须读取大量数据才能执行任务,因此在重建过程中很有可能遇到 URE。
这个问题是否也会影响大量数据的备份和恢复场景?如果您必须对 10TB 备份进行完全恢复,URE 似乎同样有可能。
答案1
关于URE和RAID5的真正问题是,一旦遇到哪怕一个URE,许多硬件控制器就会直接中止RAID重建并宣布阵列死亡,从而全部使数据脱机。虽然这是针对潜在数据损坏的“最安全选择”,但并不总是最好的做法(例如:考虑影响空闲/未被文件系统分配的数据扇区的 URE。虽然忽略它应该是安全的,但硬件控制器会使整个阵列脱机)。
RAID6 不太容易出现 URE,因为双磁盘冗余确实降低了在同一个磁盘扇区/LBA 中同时出现 URE 的可能性。
同时,软件 RAID(例如:mdadm)通常比硬件 RAID 灵活得多,即使发现一些 URE,也能够恢复降级的 RAID5 阵列。
从备份恢复时,您通常会拥有更灵活的工具;这意味着在常见情况下,您可以跳过损坏/无法读取的扇区并继续恢复其他数据。
答案2
卷上的任何东西都存在风险
如果您表示担心卷/LUN 上的 URE,该卷/LUN 遭受 RAID 5/6 驱动器故障,则该卷上的所有数据都将面临风险。
确保将数据存储在与备份不同的卷/LUN 上。最佳做法是将备份存储在与生产数据完全不同的存储设备上。
URE 通常处于块级别,因此该卷上的任何内容都存在损坏风险。块级格式在堆栈中处于较低位置。NTFS 或 VMFS(任何格式)处于块级别,依此类推。由于 RAID 卷上的块级别低于所有内容,因此块级别问题会影响其上的所有数据。
我希望我能正确回答你的问题。
答案3
原则上是的,但如果您将备份存储在 RAID6 上(作为示例),您将获得冗余的好处,因此总错误率将是很多较低,并且恢复期间发生 URE 的可能性也较低。
如果您使用磁带备份解决方案,错误率就会低得多(SAS:1x10^-15 - 1x10^-16,LTO7:1x10^-19)。