发生故障时如何确定 RAID 中的哪个物理磁盘需要更换?

发生故障时如何确定 RAID 中的哪个物理磁盘需要更换?

如果我配置了 RAID 阵列(使用mdadm),那么确保在某个物理磁盘发生故障时能够知道要更换哪个物理磁盘的最佳方法是什么?

cat /proc/mdstat会告诉我/dev/sda失败了。没关系。

但是当我查看物理磁盘时,哪一个是/dev/sda

如果我使用lshw -class disk,我会看到它返回一个逻辑名称(例如/dev/sda)和一个序列号。如果该序列号与磁盘外壳上的编号相对应,并且逻辑名称不变,那么我可以在每个磁盘上可见的位置写入两者。

然而,我发现由于某种原因,给出的序列号lshw有时不是驱动器外壳上的序列号。我还怀疑逻辑名称在某些情况下可能会改变。

那么有没有更好的方法?也许有一些脚本可以告诉我要切换哪个带标签的磁盘?

答案1

这个答案就我而言,推荐使用该ledmon包似乎是最好的。

使用ledctl locate=/dev/sdX是一种万无一失的方法来知道要移除哪个驱动器 - 尽管如果ledctl看不到故障的驱动器,我可能仍然必须通过消除过程来执行此操作(因此,强制对驱动器进行读/写操作,希望我能发现没有闪烁的驱动器)。

相关内容