运行 Debian 7,mdadm 3.2.5。我发出命令将 5 个磁盘、3 个备用 raid 5 阵列扩展到 8 个磁盘、0 个备用 raid 6 阵列:
mdadm --grow /dev/md0 --level=6 --raid-devices=8 --backup-file=/root/raid5backup
驱动器旋转一到五秒后,会发出一声轻微的咔嗒声,然后停止,控制台会输出大量错误消息。在谷歌上搜索这些消息(每隔 1-5 秒就会出现更多消息,所以我无法准确找到)最终我找到了这个 libata 错误消息细分页面。
根据链接页面,我的问题是“设备与主机之间的通信暂时中断,但已恢复”。看起来像是总线错误 - 可能是电缆质量低劣?这台机器有 11 个 SATA 设备,6 个通过板载连接器,另外 5 个分布在两个扩展卡上。主板是全新的。
不过我不确定如何处理这些消息。我应该关机并尝试更换电缆吗?有什么想法吗?
答案1
我的理论是,驱动器的电源无法处理负载。当您发出增长命令时,阵列中的所有驱动器都必须开始实际工作。这会消耗更多电量。电源无法供电,驱动器的电压会下降。一旦电压过低,它们的电机就会短暂关闭 - 导致磁头移至安全位置时发出咔嗒声,并且它们的逻辑控制器会与您的 SATA 控制器失去通信 - 从而导致错误。当电机关闭时,电源上的负载会降低,并且它输出的电压会恢复到正常水平。因此驱动器重新启动并重复循环。
您可以尝试使用另一个电源,从系统中删除几个驱动器(我知道这并不容易)或删除其他电源或将它们移到外部(例如,可能将风扇连接到另一个电源。)或者,您可以尝试将驱动器重新平衡到来自电源的不同电缆。(您还可以检查电源的额定值和所连接设备的额定值,看看是否处于安全范围内。)