关于硬盘URE,我知道以下几点:
- 由于某些原因,当硬盘读取 FEC(前向纠错数据)无法纠正该扇区上的错误的扇区时,我们遇到了 URE。
- 我们遇到的 URE 评级很低,但仍然存在。
- 重建 RAID 5 阵列时,有时会发生这种情况,重建进度会停止。
但我还有一些问题:
- 如果只有一个磁盘,会发生什么?硬件/文件系统报告错误,我们丢失了一个文件?或者我们得到了包含错误数据的文件?
- 向该 URE 扇区重写一些数据是否可以使该扇区恢复正常?还是必须使用硬盘制造商提供的一些实用程序并重新映射另一个保留扇区?
- 如果在镜像/重新镜像 RAID 1/10 阵列时发生这种情况,RAID 控制器会做什么?停止镜像进程?还是只是将不正确的数据复制到另一个磁盘?
谢谢回答,问题1&2已解决。
但第三个问题是,如果在通过添加另一个新磁盘将单个 HDD 转换为 RAID 1 阵列时遇到 URE,或者在 RAID 1/10 阵列中更换故障磁盘,则没有冗余来纠正错误。它会使用错误数据完成镜像/重新镜像过程吗?还是像 RAID 5 重建那样停止进程?
答案1
- 对于单个磁盘,不可恢复的错误就是无法恢复的错误 - 无法恢复,并且会报告给文件系统,然后报告给尝试读取文件的应用程序。通常,最好是获得明确的错误,而不是不可靠的数据。
- 写入不可读扇区将修复物理扇区(例如,由于断电而中断写入时发生的软错误),或者驱动器将逻辑扇区映射到其备用池之一。这由驱动器自行决定,通常不是用户/驱动程序可选择的。
- RAID 控制器很可能会修复扇区 - 无论是通过镜像还是通过从冗余集重建数据。如果在镜像或重建期间发生(另一个)读取错误阻止了此修复,则错误会一直存在并且阵列会损坏。某些 RAID 集可以修复多个错误(RAID 6 或某些嵌套 RAID),但一旦错误堆积起来,您就没那么幸运了。
确保错误不会堆积在很少使用的扇区上非常重要 - 如果扇区几个月甚至几年都未读取,它们可能会变成无法纠正的错误。因此,请确保启用数据清理、介质巡逻、巡逻读取或硬件上的任何功能,以定期检查所有数据。这样,您就可以确保在需要时重建工作。
有人报告说,在重建过程中,额外的驱动器会因为压力而开始出现故障,但我发现这是无稽之谈。驱动器只是因为陈旧、累积的错误而出现故障。即使是非常旧的驱动器,你也可以连续几天承受压力而不会出现任何问题。