除了交换文件之外,还有哪些原因导致 RAID 1/10 mismatch_cnt > 0?

除了交换文件之外,还有哪些原因导致 RAID 1/10 mismatch_cnt > 0?

我的四台服务器中,有两台目前有mismatch_cnt大约 40000 个数据,这让我很担心。我们正在使用 RAID10 设置。手册指出,

然而,在 RAID1 和 RAID10 上,软件问题可能会导致报告不匹配。这并不一定意味着阵列上的数据已损坏。可能只是系统不关心阵列的该部分存储了什么 - 它是未使用的空间。

我们的服务器上不使用任何交换文件。服务器的一个硬盘驱动器的 SMART 自检失败,并且可用空间太小。托管服务提供商表示,只有硬盘驱动器出现物理故障时才会更换。

我认为我没有理解这个参数的真正含义和用处。这个参数有这么大的值的其他原因可能是什么?如果这是镜像阵列,那么系统怎么可能不关心阵列那部分的内容呢?出于安全考虑,我认为系统也应该同步可用空间,然后 - 还剩下什么?

是否有任何可靠的方法来评估服务器中特定 HDD 的风险?

答案1

mismatch_cnt通常, RAID1/10 阵列的高位有两个原因:

  • 交换阵列
  • 非常快的文件创建/写入/重写/删除工作负载

上述理由是无害的:尽管它们指出数组中的差异(基本上是一个非同步数组),它们是关于没用过磁盘空间。

然而,还有一个更令人担忧和危险的mismatch_cnt原因:硬件问题(即:故障电源提供不一致的电力和/或行为不当的磁盘 DRAM 芯片)可能会改变正在传输的数据,导致两个磁盘之间出现许多不一致。

您可以找到更多信息此主题在 linux-raid 邮件列表中。

相关内容