Centos 6.9
因此,在重新配置它们所属的 raid 后,我有两个 40TB 卷至少名义上出现故障。raid 卷没有问题,但在安装它们时,一个报告“无法读取超级块”,另一个报告“文件系统类型错误、选项错误、超级块错误”。
然后我犯了一个错误,同时在两个服务器上运行 xfs_repair(它们在同一个文件服务器上),现在我明白这是内存问题。文件服务器有 64GB 内存,但交换空间只有一半。因此服务器内存不足,其中一个 xfs_repair 进程被终止。现在第二个进程仍在运行,但它已经卡住了很长时间,没有进展,CPU 使用率为 0%。
我认为我必须终止卡住的 xfs_repair 进程,但这让我很紧张。我还可以尝试其他方法吗?
至于正在修复且其进程已被终止的其他卷,我尝试安装它并且现在它正在正确安装。
谢谢您的任何建议。
答案1
一般来说,终止执行低级操作的进程并不安全。不过,就你的情况而言,由于其他驱动器正在运行,所以你有一个安全网。
假设这两个卷设置为 RAID 1,您现在可以卸载可以正常工作的卷(只是为了额外的安全),终止 xfs_repair 进程并评估被中断的卷的状态,然后如果它不工作的话,只需将好的卷(之前卸载的)恢复到其中。
鉴于该进程的使用率为 0%,它可能已死锁,这意味着必须被杀死,无论是否安全,情况都是如此。关机或重启都会隐式地杀死它,所以我建议你继续自己做,这样可以更好地控制正在发生的事情。如果发生了一些不好的事情,它可能已经发生了或无法避免。