在我家里的台式机简单重启后,我收到以下消息:
Non-System disk or disk error
replace and strike any key when ready
插入 Debian live usb 后,我可以通过磁盘 GUI 检查以下信息:
Contents: Unknown (promise_fasttrack_raid_member)
考虑到我从未在台式机上尝试过 RAID,我完全不明白为什么会出现这样的 RAID 问题。
即便如此,我还是尝试在 BIOS 中启用/禁用 RAID 模式,但问题仍然存在。
不确定是否有关联,但就在出现上述问题之前,我正在浏览网页和rsync
一些文件夹。
由于rsync
花费的时间太长,我按下了 ctl+c 并重新启动。之后问题就开始了。
问题
这是什么
promise_fasttrack_raid_member
意思?非 raid 系统中怎么会出现 raid 问题?SSD SMART 总体评估为“磁盘正常,8 个坏扇区”。但是,一些 SMART 属性看起来很奇怪:
- 重新分配事件计数 55
- 当前待处理部门 8
- UDMA_CRC_错误计数 8
考虑到这款 SSD 相当新(≈6 个月大)并且没有用于重负荷循环(仅供个人使用),我是否应该担心它的健康状况?
有什么办法可以修复它吗?
附加信息
系统规格
操作系统:Debian GNU/Linux 11(靶心)
存储:SSD 500GB Goldenfir
产品名称:HP Compaq dc5850 SFF PC
user@debian:~$ sudo dmidecode --type baseboard # dmidecode 3.3 Getting SMBIOS data from sysfs. SMBIOS 2.5 present. Handle 0x0003, DMI type 2, 8 bytes Base Board Information Manufacturer: Hewlett-Packard Product Name: 3029h Version: Not Specified [...]
主板型号:HP 3029h
user@debian:~$ sudo dmidecode --type system # dmidecode 3.3 Getting SMBIOS data from sysfs. SMBIOS 2.5 present. Handle 0x0002, DMI type 1, 27 bytes System Information Manufacturer: Hewlett-Packard Product Name: HP Compaq dc5850 SFF PC [...]
调试
user@debian:~$ sudo blkid /dev/sda
/dev/sda: TYPE="promise_fasttrack_raid_member"
user@debian:~$ lsblk /dev/sda
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 465.8G 0 disk
user@debian:~$ sudo fdisk /dev/sda -l
Disk /dev/sda: 465.76 GiB, 500107862016 bytes, 976773168 sectors
Disk model: SSD 500GB
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
user@debian:~$ sudo parted /dev/sda print
Error: /dev/sda: unrecognised disk label
Model: ATA SSD 500GB (scsi)
Disk /dev/sda: 500GB
Sector size (logical/physical): 512B/512B
Partition Table: unknown
Disk Flags:
user@debian:~$ sudo smartctl --health /dev/sda
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-10-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
user@debian:~$ sudo smartctl /dev/sda -A
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-10-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x0032 100 100 050 Old_age Always - 0
5 Reallocated_Sector_Ct 0x0032 100 100 050 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 050 Old_age Always - 2927
12 Power_Cycle_Count 0x0032 100 100 050 Old_age Always - 454
160 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 0
161 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 89
163 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 498
164 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 368
165 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 160
166 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 15
167 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 76
168 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 0
169 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 100
175 Program_Fail_Count_Chip 0x0032 100 100 050 Old_age Always - 608239772
176 Erase_Fail_Count_Chip 0x0032 100 100 050 Old_age Always - 77063
177 Wear_Leveling_Count 0x0032 100 100 050 Old_age Always - 86738546
178 Used_Rsvd_Blk_Cnt_Chip 0x0032 100 100 050 Old_age Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 050 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 050 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 050 Old_age Always - 58
194 Temperature_Celsius 0x0032 100 100 050 Old_age Always - 40
195 Hardware_ECC_Recovered 0x0032 100 100 050 Old_age Always - 699294
196 Reallocated_Event_Count 0x0032 100 100 050 Old_age Always - 55
197 Current_Pending_Sector 0x0032 100 100 050 Old_age Always - 8
198 Offline_Uncorrectable 0x0032 100 100 050 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x0032 100 100 050 Old_age Always - 8
232 Available_Reservd_Space 0x0032 100 100 050 Old_age Always - 89
241 Total_LBAs_Written 0x0032 100 100 050 Old_age Always - 288010
242 Total_LBAs_Read 0x0032 100 100 050 Old_age Always - 204821
答案1
以下 SMART 属性令人担忧:
Reallocated_Event_Count 55
Current_Pending_Sector 8
UDMA_CRC_Error_Count 8
这意味着磁盘上有 55 个十六进制(85 个十进制)坏扇区。这本身并不算太糟,但你还有 8 个坏扇区 当前待处理部门数量,其定义为:
该属性的原始值表示等待重新映射的扇区总数。
这意味着固件已检测到 8 个坏扇区,并且仍在尝试恢复其数据,但没有成功。如果将来成功,该值将减少,但如果失败,则一段时间后它们将变成硬错误。
您的磁盘似乎出现故障。您遇到的错误可能意味着其中一个坏扇区位于磁盘头内,因此导致磁盘被错误地识别为 RAID 磁盘。
我建议挽救您的数据(如果您没有备份)并更换磁盘。
请注意,下面的大数不必担心,因为这里的大数是 好的迹象:
Hardware_ECC_Recovered 699294