3 块硬盘中的 1 块(Western Digitial WD3003FZEX 黑色 3TB SATA 6GB/S 7200RPM 64MB 缓存 3.5 英寸硬盘)在 RAID 0 阵列中发生故障。起初,它会从操作系统中消失。然后,重新插入电缆后它会重新出现,但不稳定。
开机/重启几个小时后,mdadm 可以读出序列号,ddrescue 以平均 2 MB/s 的速度读出大约 90GB 的数据。问题出现后,序列号变为空,ddrescue 读取 0 字节,没有任何读取成功。
I/O Controller : /sys/devices/pci0000:00/0000:00:1f.2 (SATA)
Port2 : /dev/sdd (WD-WMC5D0D9X6D8)
Port3 : /dev/sde (WD-WMC1F0EARDW0)
Port1 : /dev/sdc ()
正常时智能信息
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 138 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 253 143 021 Pre-fail Always - 4966
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 236
5 Reallocated_Sector_Ct 0x0033 194 194 140 Pre-fail Always - 179
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 051 051 000 Old_age Always - 35906
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 213
16 Unknown_Attribute 0x0022 149 051 000 Old_age Always - 2633891565010
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 130
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 107
194 Temperature_Celsius 0x0022 119 081 000 Old_age Always - 33
196 Reallocated_Event_Count 0x0032 113 113 000 Old_age Always - 87
197 Current_Pending_Sector 0x0032 197 196 000 Old_age Always - 1765
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
主板是 ASUS X99-E USB 3.1,RAID 0 用 Intel RST 设置,BIOS 中的 I/O 控制器仍处于 RAID 模式。但是,现在 BIOS 中的 raid 阵列仅由 WD-WMC5D0D9X6D8 和 WD-WMC1F0EARDW0 组成,损坏的驱动器现在是非成员驱动器。系统必须以某种方式检测到驱动器故障并自动将其从阵列中移除。
我想克隆故障驱动器。我是否应该继续重启机器?是否有任何命令可以让我仅重启/重置硬盘而不是整个系统?还有其他解决方法吗?谢谢。