所以我得到了这个服务器,并且其中一个驱动器上有视觉警报。
经过进一步调查,storcli
我注意到它有几个media error counts
。
我对此进行了一些调查,显然这些错误是磁盘扇区无法纠正的损坏,因此需要重新映射,以便不使用该扇区。
但显然几乎所有驱动器都有此类错误,而且它们也是由制造缺陷引起的。
我有几个问题:
- 如果这是正常的,为什么只出现几个错误就会显示视觉警报?
- 如何使用 storcli 查看有关这些错误的更多详细信息
- 有人可以向我解释一下什么是
other error count
和shield count
如果我误解了什么,请向我解释。
谢谢
答案1
我确认这media error counts
意味着物理扇区出现问题,通常是在应用程序读取或阵列清理期间发现的。
在这种情况下,“扇区损坏”意味着物理磁盘无法读取原始扇区,从而向 RAID 控制器返回错误。HDD 本身可以将扇区标记为“要重新映射”这一事实对 RAID 控制器来说是透明的,RAID 控制器将尝试使用来自另一个镜像支路/奇偶校验的数据重写同一扇区。如果此重写失败(意味着驱动器本身没有可用的备用扇区),则磁盘通常会被标记为故障。
如果偶尔发生,此类读取错误并不太令人担忧,事实上,大多数 RAID 控制器仅在超过某个错误阈值后才将磁盘标记为坏盘。换句话说,只会报告 1 个介质错误,而 100 多个错误肯定也会将磁盘标记为坏盘(或“预计很快会失效”状态)。