RAID1 mdadm,自动使驱动器故障并避免只读文件系统?

RAID1 mdadm,自动使驱动器故障并避免只读文件系统?

我正在管理一台在 mdadm RAID1 中配置了两个固态硬盘的服务器。该服务器运行的是带有 ext4 文件系统的 RHEL6。

今天晚上,夜间备份开始后不久,服务器就离线了,控制台报告磁盘错误:在此处输入图片描述

登录控制台后,我发现其中一个磁盘已被 mdadm 标记为故障,并且文件系统被设置为只读。

有没有办法可以配置 mdadm 以在文件系统重新以只读方式挂载之前使驱动器故障?我宁愿短时间以单磁盘系统运行(直到可以安装替换磁盘),而不是立即将文件系统置于只读模式 - 这将导致中断。

答案1

默认情况下它会这样做,但我确实遇到过类似的问题。MD 并不热衷于磁盘故障(或者实际上通过重写来修复扇区,而硬件 RAID 控制器会这样做)。这就是为什么我设置日志监控来扫描“ata 异常”并在发生这种情况时给我发送电子邮件。至少对于传统 HDD,这可以让您更快地发现磁盘故障。

如果文件系统被标记为只读,错误会沿着链条向上传递,MD 设备也会发现错误。你确定 sdb 上没有错误吗?

或者,您确定驱动器完全失效了吗?最近我遇到过这种情况,整个 PCI 总线都失效了。所有连接到它的设备都开始出现错误(所有 ATA 和以太网),而且文件系统确实被标记为只读,MD 阵列也失效了。但显然磁盘或 MD 不是问题所在。

检查驱动器是否有错误:我对 SSD 驱动器上的 SMART 没有太多经验,但至少对于 HDD 驱动器,SMART 日志可能会显示一些内容;其中有一个错误日志,您可以查看智能参数,或许可以与其他磁盘进行比较。

如果安装了 smartmontools,您可以执行以下操作:

smartctl -a /dev/sda

您也可能对。。。有兴趣如何排除 RAID 阵列故障

编辑:至于 PCI 总线问题。看起来您的问题只局限于一个磁盘或控制器。

相关内容