在发生故障之前更换 raid 硬盘（3 年前！）

Question 1

这是一个坏主意，因为您故意降低 RAID 性能，并且重新同步可能会意外失败。最好将新磁盘连接到系统（这样您就有n+1磁盘），然后用于mdadm --replace同步它。这样，RAID 在此期间就不会降级。

您不必通过故障/删除驱动器来找出哪个是哪个。您可以在中看到设备的角色编号mdadm --examine，在 mdstat 输出[UUU]中角色编号为[012]；您可以使用hdparm或检查驱动器的序列号smartctl，并与驱动器本身的标签进行比较。

对于分区来说，现在使用 GPT 可能比 MSDOS 更好。如果您不仅要更换磁盘，还要升级它们的大小，那么您可能别无选择，因为 MSDOS 分区几乎止步于 2TB。

就我个人而言，我根本不这样做。如果磁盘已经使用了 3 年怎么办？磁盘的寿命比这长得多，而新磁盘同样会失效。

更重要的是定期（自动）测试磁盘，并在磁盘出现第一个挂起/无法纠正/重新分配的扇区、自测试中读取错误或其他问题时更换磁盘。

更重要的是备份您不想丢失的任何数据。

您也可以切换到 RAID6 以获得更多冗余，但只要您主动检查错误，两个磁盘同时失效的情况就不太可能发生。不要让你的重建成为你多年来的第一次阅读测试。

Answer

这是一个坏主意，因为您故意降低 RAID 性能，并且重新同步可能会意外失败。最好将新磁盘连接到系统（这样您就有n+1磁盘），然后用于mdadm --replace同步它。这样，RAID 在此期间就不会降级。

您不必通过故障/删除驱动器来找出哪个是哪个。您可以在中看到设备的角色编号mdadm --examine，在 mdstat 输出[UUU]中角色编号为[012]；您可以使用hdparm或检查驱动器的序列号smartctl，并与驱动器本身的标签进行比较。

对于分区来说，现在使用 GPT 可能比 MSDOS 更好。如果您不仅要更换磁盘，还要升级它们的大小，那么您可能别无选择，因为 MSDOS 分区几乎止步于 2TB。

就我个人而言，我根本不这样做。如果磁盘已经使用了 3 年怎么办？磁盘的寿命比这长得多，而新磁盘同样会失效。

更重要的是定期（自动）测试磁盘，并在磁盘出现第一个挂起/无法纠正/重新分配的扇区、自测试中读取错误或其他问题时更换磁盘。

更重要的是备份您不想丢失的任何数据。

您也可以切换到 RAID6 以获得更多冗余，但只要您主动检查错误，两个磁盘同时失效的情况就不太可能发生。不要让你的重建成为你多年来的第一次阅读测试。

Question 2

您的第一步是不必要的，并且仍然不能保证始终/dev/sdX保持稳定（即它指向同一设备）。在最坏的情况下，再次插入会触发一些长时间运行的重新同步操作。

更好、更可靠的方法是使用驱动器的序列号（S/N、SN）。它们打印在驱动器上并且可以从系统中查询。

例如，查看一个随机系统：

# cat /proc/mdstat 
Personalities : [raid1] 
md126 : active raid1 sda2[0] sdb2[2]
      976245464 blocks super 1.2 [2/2] [UU]
      bitmap: 1/8 pages [4KB], 65536KB chunk

然后我可以通过以下方式获取 sda 的序列号：

# hdparm -i /dev/sda

/dev/sda:

 Model=SAMSUNG HD103UJ, FwRev=1AA01113, SerialNo=S13PJ0123456789

（我修改了实际的序列号）

我还可以通过查看下面的符号链接来获取序列号/dev/disk/by-id：

# ls -l /dev/disk/by-id | grep 'sda$'
lrwxrwxrwx. 1 root root  9 2016-08-05 09:49 ata-SAMSUNG_HD103UJ_S13PJ0123456789 \
  -> ../../sda

因此，我可以记下要更换的驱动器的序列号，关闭系统电源，然后用匹配的序列号（印在驱动器标签上）更换驱动器。

专业提示#1：添加新驱动器时，将序列号写在额外的标签上，并将该标签放在直接可见的一侧（例如连接器一侧）。

/dev/disk/by-id/...将新设备添加到 RAID 时，这些链接也很方便。

专业提示#2：选择异构驱动器，即使用来自独立制造商、已经具有不同通电时间的驱动器等。因此，您可以降低由于系统问题而发生多次故障的可能性。

专业提示 #3：使用 BTRFS 或 ZFS 等校验和文件系统。除了校验和的好处之外，它们还支持更换驱动器，而无需先将其卸下。

Answer