我有一个硬件 RAID(Adaptec 5805,八个 6TB 驱动器的 RAID 6),最近在进行大量磁盘写入时,它不断出现故障。我将 Ubuntu 安装在单独的磁盘上,当 RAID 变得不理想或降级时,Ubuntu 似乎无法阻止我写入。因此,当我发现阵列无法恢复时,已经太晚了。在我重建 RAID 和复制数据时,这种情况发生了两次。
我猜想 RAID 故障问题是由于电源不稳定造成的。但是,在找出电源问题的根源之前,我可以调整哪些设置以允许 RAID 向系统发出警报,以便系统将阵列重新安装为只读?
答案1
你不需要。这就是 RAID 的重点:操作系统没有知道单个驱动器发生故障,但可以继续顺利运行。
我想你可以将某些东西连接到命令中mdadm --monitor
,以便在发生降级事件时运行自定义脚本mount -o ro,remount /dev/md/N
,但这似乎是在给猪涂口红。你应该运行不易出现重建错误的 RAID 级别和配置。我想你可能有大型旋转盘片磁盘并使用 RAID-5?这就是我们在业务中所说的“灾难的根源”。你会过得很糟糕。使用 RAID-6(至少),手头有备用磁盘。