“降级数组事件”

“降级数组事件”

我的 Raspi 上有一个 RAID 1,并收到了我不理解的邮件,标题为“/dev/md0:my-host-name 上的 DegradedArray 事件”和“/dev/md0:my-host-name 上的失败事件”。我收到了 6 条关于前一个主题的消息,2 条关于后者的消息。

第一种邮件如下所示:

这是由在 my-host-name 上运行的 mdadm 自动生成的邮件消息

在 md 设备 /dev/md0 上检测到 DegradedArray 事件。

忠实于你的,等等。

PS /proc/mdstat 文件当前包含以下内容:

个性:[raid1] md0:活动 raid1 sda1[0] 124967936 块超级 1.2 [2/1] [U_] 位图:1/1 页 [4KB],65536KB 块

未使用的设备:

第二种邮件是这样的:

这是由在 my-host-name 上运行的 mdadm 自动生成的邮件消息

在 md 设备 /dev/md0 上检测到失败事件。

它可能与组件设备 /dev/sdb1 有关。

忠实于你的,等等。

PS /proc/mdstat 文件当前包含以下内容:

个性:[raid1] md0:活动 raid1 sdb11(F) sda1[0] 124967936 块超级 1.2 [2/1] [U_] 位图:0/1 页 [0KB],65536KB 块

未使用的设备:

在了解这些消息之前,我重新启动了 Raspi。这是当前 RAID 状态:

个性:[raid1] md0:活动 raid1 sdb11 sda1[0] 124967936 块超级 1.2 [2/2] [UU] 位图:0/1 页 [0KB],65536KB 块

未使用的设备:

事件发生时我没有触摸 Raspi 或其驱动器。但是,我不能排除其他人这样做并可能松开其中一根数据线的连接。

这发生了吗?是不是发生了其他事情? RAID 是否已自行恢复正常运行,或者我是否需要执行某些操作?

可能相关:安全信息邮件的含义

答案1

第一条消息意味着您的 RAID 阵列进入不一致状态,因为显然sdb驱动器被检测为故障(第二条消息)。当前状态看起来像是阵列已恢复,但您可能需要检查 的输出以smartctl --all /dev/sdb获取当前运行状况(在驱动器参数和错误日志之前打印)并检查驱动器参数是否可疑(例如Reallocated Sector CountCurrent Pending Sector提示潜在问题)或者设备的错误日志中是否有(新)条目。您可能还想检查dmesg与 相关的消息sdb

为了额外的安全性,您还可以sdb1从 RAID 阵列中删除并对其执行测试smartctl(例如,smartctl -t short /dev/sdb进行简短测试或smartctl -t long /dev/sdb更彻底的测试)。

请注意,您需要使用-d <...>适合您设备的smartctl参数<...>。参考此受支持 USB 设备列表为了正确的一个。要获取 USB ID,您可以使用lsusb.如果您的设备未列出,您可以查找相关设备(例如,来自同一供应商或具有相似名称)。

相关内容