快速背景:我有一个 RAID 1 阵列,使用mdadm
.两个驱动器都是硬盘驱动器。 RAID 阵列称为md127
。此 RAID 阵列中有 3 个分区: 20G /var
、20G/opt
和 891.4G /home
。
/home
尝试检查目录中的文件后,它输出:
ls: reading directory '.': Input/output error
检查dmesg后,这个错误出现很多:
md: super_written gets error=10
该命令mdadm -D /dev/md127
产生以下输出:
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
- 0 0 1 removed
1 8 17 - faulty /dev/sdb1
我认为 RAID 阵列驻留在一个分区下,例如sda1
,但这表明另一个分区位于sdb1
.运行后lsblk
,sdb1
不显示(我猜是因为它有问题)。我不记得移除过 RAID 阵列中的任何驱动器。是否有可能其中一个驱动器实际上已损坏?
输出cat /proc/partitions
:
259 0 244198584 nvme0n1
259 1 510976 nvme0n1p1
259 2 101376 nvme0n1p2
259 3 16384 nvme0n1p3
259 4 40816640 nvme0n1p4
259 5 202752167 nvme0n1p5
8 0 976762584 sda
8 1 976748544 sda1
8 16 976762584 sdb
8 17 976748544 sdb1
8 32 1953514584 sdc
8 33 16367 sdc1
8 34 1953497088 sdc2
8 48 1953481728 sdd
8 49 1953481727 sdd1
8 64 7815168 sde
8 65 7814144 sde1
9 127 976617472 md127
259 6 20971520 md127p1
259 7 20971520 md127p2
259 8 934674431 md127p3
输出cat /proc/mdstat
:
md127 : active raid1 sdb1[1] sda1[0]
976617472 blocks super 1.2 [2/2] [UU]
bitmap: 3/8 pages [12KB], 65536KB chunk
unused devices: <none>
我读过,如果有下划线而不是“U”,则表明驱动器出现故障。另外,重新启动计算机后,我决定解决这个问题,发现我遇到问题的目录(输入/输出错误)现在列出了所有没有问题的文件。我也跑了dmesg
,所有(主要)错误都消失了。我认为这可能与启动有关。当Linux启动时,进入类似终端的界面进行登录,然后切换到自定义的Adapta主题,有时登录时会冻结。对于这一变化最合理的解释是什么?
答案1
First check the status of disk sdb by below command
sudo smartctl -H /dev/sdb if it shows PASSED OR OK Then its in good condition
Try re-adding disk /dev/sdb1 to raid by below command
Steps to remove
sudo mdadm --manage /dev/md127 --fail /dev/sdb
sudo mdadm --manage /dev/md127 --remove /dev/sdb
Add back to array
sudo mdadm --manage /dev/md127 --add /dev/sdb