禁用 mdadm 对缺少驱动器的“降级” RAID1 发出的警告

禁用 mdadm 对缺少驱动器的“降级” RAID1 发出的警告

最近,由于驱动器故障,我的服务器中断了。因此,这次我使用新的 SSD 以 RAID1 形式设置了服务器,但直到我设法获得另一个 SSD 驱动器,基于 mdadm 的 RAID1 才使用 1 个设备运行,并且处于降级模式。(我知道现在并不安全,但这只是为了准备!)没有发生故障的设备,RAID1 处于预期状态。所以我不想被这些电子邮件打扰。

我如何才能专门禁用针对特定 RAID 设备“降级”的警告?

该警告是由 mdadm 监控向系统发送的root。我认为每天一次。

This is an automatically generated mail message from mdadm
running on MY_HOSTNAME

A DegradedArray event had been detected on md device /dev/md/0.

Faithfully yours, etc.

P.S. The /proc/mdstat file currently contains the following:

Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md1 : active raid1 sda2[0]
      156011520 blocks super 1.2 [2/1] [U_]
      bitmap: 2/2 pages [8KB], 65536KB chunk

md0 : active raid1 sda1[0]
      144384 blocks super 1.2 [2/1] [U_]

unused devices: <none>

答案1

永久运行mdmonitor.service并立即通知 mdadm 设备的变化。

每日警告由 生成。我可以通过临时插入脚本顶部来/etc/cron.daily/mdadm禁用每日警告。exit 0

不过,这种方法不太具体。我找不到忽略特定 mdadm 设备的方法。但由于 mdmonitor 无论如何都会通知更改,所以这种方法可能是可以接受的。

答案2

每日警告会发送到MAILADDR变量中的电子邮件地址/etc/mdadm/mdadm.conf- 默认情况下它是“root”,因此是“root@localhost”,但可以是 /usr/sbin/sendmail 可以发送的任何内容

因此,您可以将其别名化为单独的邮箱,例如 /dev/null

或者,您可以将其别名为一组单独的邮件过滤器,例如 maildrop 过滤器,检查它是否与特定设备有关,然后将其丢弃;否则将其发送给您

答案3

今天,我在要迁移的另一个系统上遇到了类似的情况:我从 RAID1 中移除了一个磁盘,以便将数据转移到新系统。旧阵列现在已“降级”,但很快就会被完全移除。该系统包含另一个有效的 RAID5 阵列,具有冗余功能——所以我不是想要完全禁用通知。

我设法将磁盘数量从 2 个减少到 1 个,以使阵列状态再次恢复正常:

root@server:~# mdadm --grow --raid-devices=1 /dev/md127
mdadm: '1' is an unusual number of drives for an array, so it is probably
     a mistake.  If you really mean it you will need to specify --force before
     setting the number of drives.
root@server:~# mdadm --grow --force --raid-devices=1 /dev/md127
raid_disks for /dev/md127 set to 1

之前我每天都会收到有关两个阵列降级的通知,状态为[U_]

root@server:~# cat /proc/mdstat 
Personalities : [raid1] [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid10] 
md125 : active raid5 sdc1[3] sde1[7] sdd1[4] sdf1[5]
      5849607168 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
      
md126 : active raid1 sda2[0]
      232651776 blocks super 1.2 [2/1] [U_]
      bitmap: 2/2 pages [8KB], 65536KB chunk

md127 : active raid1 sda1[0]
      152576 blocks super 1.2 [2/1] [U_]
      
unused devices: <none>

您现在可以看到两个 RAID 设备的状态为[U]

root@server:~# cat /proc/mdstat
Personalities : [raid1] [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid10] 
md125 : active raid5 sdc1[3] sde1[7] sdd1[4] sdf1[5]
      5849607168 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
      
md126 : active raid1 sda2[0]
      232651776 blocks super 1.2 [1/1] [U]
      bitmap: 2/2 pages [8KB], 65536KB chunk

md127 : active raid1 sda1[0]
      152576 blocks super 1.2 [1/1] [U]
      
unused devices: <none>

如果需要,您可以稍后再次增加设备数量。

相关内容