昨天,我服务器上的一个 SSD 出现故障。好吧,至少mdadm --detail /dev/md126
这么说。还mdstat
显示[2/1] [_U]
在其中一个 raid 分区上(特别是 md126)。我无法创建任何文件或编辑任何内容,因为 raid 处于只读模式(例如,如果我尝试使用 tab 在终端中自动完成任何内容,它会显示消息cannot create temp file for here-document: Read-only file system
)Raid 的状态是clean, degraded
,并且sda3
分区被标记为已移除,如下所示为有故障。
我使用以下命令成功重新连接了“故障”分区:
mdadm --remove /dev/md126 /dev/sda3
mdadm --add /dev/md126 /dev/sda3
现在mdadm --detail /dev/md126
显示两个分区都处于活动状态,状态干净,一切正常。mdstat
还有—— [2/2] [UU]
。
但似乎只读问题并未消失。无法创建任何文件。尝试重新安装系统mount -o rw,remount /
- 失败 ( mount: cannot remount /dev/md126 read-write, is write-protected
)。也尝试过mdadm --readwrite /dev/md126
- 结果相同 ( mdadm: failed to set writable for /dev/md126: Device or resource busy
)。
我没主意了。我需要在不重启服务器的情况下恢复全部功能。
Ps sda 驱动器的 iowait 很高,%util 通常为 100(至少在崩溃之前是这样的)。这是 SSD 即将报废的迹象吗?