我遇到了一个神秘的问题:我在我的一台服务器上安装了具有 7 个 1.5 TB 磁盘的 raid5 阵列,在内核 2.6.x 和元数据 0.9 下运行了几年,没有出现任何问题。
在过去的几周里,我将此服务器更新为具有实际内核的新系统,并使用元数据 1.2 重新启动 raid。在此之后,我从备份中恢复了所有数据并对其进行了验证。我对这种事情有点偏执,因为当内存、磁盘或 scsi 总线产生损坏的数据时,我丢失了一些数据。一个文件的验证失败。所以我检查了整个 raid 并发现一个位置存在读取错误。我用旧系统将 raid 更改为旧格式并再次测试。没有错误。我使用新内核重新启动并再次检查:没有错误。
目前我对整个突袭进行了完整性检查(需要 150 小时左右)。
但是为什么如果我使用元数据 1.2(内核 5.4.66),我的 raid5 会出现读取错误,而使用元数据 0.9 则没有错误。
我使用没有分区的整个 raid 驱动器,它有 7 个相同类型的磁盘。
这让我抓狂了!
有效期