LSI MegaRaid 的介质错误计数是什么意思?

LSI MegaRaid 的介质错误计数是什么意思?

所以我得到了这个服务器,并且其中一个驱动器上有视觉警报。
经过进一步调查,storcli我注意到它有几个media error counts

我对此进行了一些调查,显然这些错误是磁盘扇区无法纠正的损坏,因此需要重新映射,以便不使用该扇区。
但显然几乎所有驱动器都有此类错误,而且它们也是由制造缺陷引起的。

我有几个问题:

  1. 如果这是正常的,为什么只出现几个错误就会显示视觉警报?
  2. 如何使用 storcli 查看有关这些错误的更多详细信息
  3. 有人可以向我解释一下什么是other error countshield count

如果我误解了什么,请向我解释。

谢谢

答案1

我确认这media error counts意味着物理扇区出现问题,通常是在应用程序读取或阵列清理期间发现的。

在这种情况下,“扇区损坏”意味着物理磁盘无法读取原始扇区,从而向 RAID 控制器返回错误。HDD 本身可以将扇区标记为“要重新映射”这一事实对 RAID 控制器来说是透明的,RAID 控制器将尝试使用来自另一个镜像支路/奇偶校验的数据重写同一扇区。如果此重写失败(意味着驱动器本身没有可用的备用扇区),则磁盘通常会被标记为故障。

如果偶尔发生,此类读取错误并不太令人担忧,事实上,大多数 RAID 控制器仅在超过某个错误阈值后才将磁盘标记为坏盘。换句话说,只会报告 1 个介质错误,而 100 多个错误肯定也会将磁盘标记为坏盘(或“预计很快会失效”状态)。

相关内容