我的 Windows Server 2012 R2 上的一个硬盘开始出现故障,但我发现得太晚了 - 当时我无法读取一个文件并且在读取时出现一些奇怪的错误。
使用 GUI 工具检查驱动器后,显示一切正常。
然后我检查了一下chkdsk
:
chkdsk d: /f /r
.................................
Stage 4: Looking for bad clusters in user file data ...
A disk read error occurredc0000010
The disk does not have enough space to replace bad clusters
detected in file 191666 of name \RECEIV~1\Langs\E141~1\New\202004~1.mp4.
235248 files processed.
File data verification completed
因此,我得出结论:硬盘正在默默地重新定位扇区,直到没有剩余的备用扇区为止。
我认为是时候使用一些在服务器后台运行的 SMART 报告工具了。您会选择哪种?或者 Windows Server 2012 R2 中可能有一些内置功能?
更新
这是驱动器的 SMART 信息
*** DiskCheckup V3.5 Build: 1002 Report ***
SysInfo DLL Version: SysInfo v2.3 Build: 1000
Time of export: 15:27:38 03-Nov-2022
Device information:
Device ID: 1
Interface: USB
Device Capacity: 3815445 MB
Serial Number: XXXXXXXXX
Model Number: TOSHIBA MQ04UBB400
Firmware Revision: JS000U
Partitions:
D: 3815317 MB
ATA information:
Disk geometry:
Cylinders: 486401
Tracks/Cylinder: 255
Sectors/Track: 63
Bytes/Sector: 512
Total disk sectors: 7814037168
Logical sector size: 512
Physical sector size: 4096
Media rotation rate: 5400 RPM
Buffer size: N/A
ECC size: N/A
Standards compliance:
ATA8-ACS Supported: Yes
ATA/ATAPI-7 Supported: Yes
ATA/ATAPI-6 Supported: Yes
ATA/ATAPI-5 Supported: Yes
ATA/ATAPI-4 Supported: Yes
SATA Compliance: Yes
SATA Gen3 Signaling Speed (6.0Gb/s) Supported: No
SATA Gen2 Signaling Speed (3.0Gb/s) supported: Yes
SATA Gen1 Signaling Speed (1.5Gb/s) supported: Yes
Transport Type: Serial
SATA 3.0 Transport Compilance: Yes
SATA 2.6 Transport Compilance: Yes
SATA 2.5 Transport Compilance: Yes
SATA II: Ext Transport Compilance: Yes
SATA 1.0a Transport Compilance: Yes
ATA8-AST Transport Compilance: Yes
World Wide ID: 0000000000000000
Feature support:
SMART supported: Yes
SMART enabled: Yes
SMART self-test supported: Yes
SMART error log supported: Yes
LBA supported: Yes
IORDY supported: Yes
CFast supported: No
DMA supported: Yes
Maximum Multiword DMA mode supported: 2
Multiword DMA selected: None
Maximum UltraDMA mode supported: 5
UltraDMA selected: 5
Maximum PIO mode supported: 4
SATA Compliance: Yes
NCQ priority information supported: No
Unload while NCQ commands are outstanding supported: Yes
Phy Event Counters supported: Yes
Receipt of power management requests supported: Yes
NCQ feature set supported: Yes
Software Settings Preservation: Supported, Enabled
In-order data delivery: Not supported
Initiating power management: Supported, Disabled
DMA Setup auto-activation: Supported, Disabled
Non-zero buffer offsets: Not supported
Trusted Computing supported: No
Host Protected Area (HPA) supported: Yes
Read look-ahead supported: Yes
Read look-ahead enabled: Yes
Write cache supported: Yes
Write cache enabled: Yes
Power management supported: Yes
Security mode supported: Yes
Security mode enabled: No
Device Configuration Overlay (DCO) supported: Yes
48bit Addressing supported: Yes
Auto Acoustic Managment (AAM) supported: No
Power-up in Standby (PUIS) supported: No
Advanced Power Management (APM) supported: Yes
Advanced Power Management (APM) enabled: Yes
Current APM level: Minimum power consumption without Standby
CompactFlash Association (CFA) supported: No
General Purpose Logging (GPL) supported: Yes
Streaming supported: No
Media card pass through supported: No
Extended power conditions supported: No
Extended status reporting supported: Yes
Extended status reporting enabled: No
Write-read-verify supported: Yes
Write-read-verify enabled: No
Free-fall control supported: No
TRIM command supported: No
SCT command transport supported: Yes
NV Cache enabled: No
NV Cache Power Management supported: No
SMART ATTRIBUTES:
ID Description Status Value Worst Threshold Raw Value TEC
---------------------------------------------------------------------------------------------------------------------------------------------
1 Raw Read Error Rate OK 100 100 50 0 N/A
2 Throughput Performance OK 100 100 50 0 N/A
3 Spin Up Time OK 100 100 1 5359 N/A
4 Start/Stop Count OK 100 100 0 7453 N/A
5 Reallocated Sector Count OK 100 100 50 0 N/A
7 Seek Error Rate OK 100 100 50 0 N/A
8 Seek Time Performance OK 100 100 50 0 N/A
9 Power On Time OK 71 71 0 11938 N/A
10 Spin Retry Count OK 249 100 30 0 N/A
12 Power Cycle Count OK 100 100 0 14 N/A
191 G-sense Error Rate OK 100 100 0 0 N/A
192 Power off Retract Count OK 100 100 0 1 N/A
193 Load Cycle Count OK 97 97 0 30040 N/A
194 Temperature OK 100 100 0 31 C N/A
196 Reallocation Event Count OK 100 100 0 0 N/A
197 Current Pending Sector Count OK 100 100 0 0 N/A
198 Uncorrectable Sector Count OK 100 100 0 0 N/A
199 UltraDMA CRC Error Count OK 200 253 0 0 N/A
220 Disk shift OK 100 100 0 0 N/A
222 Loaded hours OK 99 99 0 701 N/A
223 Load/Unload retry count OK 100 100 0 0 N/A
224 Load friction OK 100 100 0 0 N/A
226 Load-in Time OK 100 100 0 275 N/A
240 Head flying hours OK 100 100 1 0 N/A
答案1
我认为是时候使用一些在服务器后台运行的 SMART 报告工具了。您会选择哪一种?
我个人最喜欢的是 HD Sentinel。它得到了积极的维护和支持,并且占用系统资源较少。
因此,我得出结论:硬盘正在默默地重新定位扇区,直到没有剩余的备用扇区为止。
这可能是这样,但我见过 chkdsk 在有大量扇区可用时抛出此消息的例子。我怀疑错误消息的准确性。首先驱动器重新分配扇区,而不是群集。从文件系统的角度来看,集群只是一个“事物”。
但是,如果驱动器本身检测到扇区存在问题,而它仍然能够从该扇区恢复数据,则可能进行静默重新分配。因此,换句话说,只有当扇区中的数据在驱动器本身执行的错误恢复程序 (ERP) 后可恢复时,驱动器才会“静默重新分配”。
在您的情况下,chkdsk 报告某个扇区是坏的,这意味着驱动器无法读取该扇区。在 SMART 中,您应该能够看到一个或多个“待处理”扇区(原始值 > 0)。此类待处理扇区仅在写入时重新分配。换句话说,如果您向扇区写入零,则这表明您愿意放弃坏扇区或待处理扇区中的数据。
再次,像 HD Sentinel 这样的工具可以尝试这样做:可以配置表面扫描仪来扫描读取错误,并且在出现错误时可以指示将零写入有问题的扇区。
但话又说回来,我建议先查看整体 SMART 值。一般来说,我建议更换已开始重新分配扇区并继续这样做的驱动器。
总结一下,行业再分配的一般条件如下:
不可恢复的写入错误
如果在错误恢复程序 (ERP) 完全执行后仍无法完成写入操作,则扇区将重新分配到备用位置。仅当写入缓存被禁用且自动重新分配失败时,才会向主机系统报告错误。
您可以使用 SMART 实用程序观察到发生这样的扇区重新分配,每个重新分配的扇区都会将“重新分配的扇区数”属性增加一(以 RAW 值表示)。
注意:如果可用的备用扇区数量达到某个阈值(例如 16 个扇区),则写入缓存功能可能会自动禁用。
未恢复的读取错误
如果读取操作在完全执行定义的 ERP(错误恢复程序)后失败,则会向主机系统报告硬错误。此位置在内部注册为重新分配的候选位置。
您可以使用 SMART 实用程序在“待处理扇区”属性中观察此类事件。
当将已注册的位置指定为写入操作的目标时,会自动执行一系列介质验证。当验证结果符合标准时,将重新分配该扇区。
因此,如果发生此事件,“待处理扇区”的 SMART RAW 值将减少,而“重新分配扇区数”将增加。
恢复读取错误
当某个扇区的读取操作失败一次,然后在特定的 ERP 步骤中恢复时,该扇区的数据将自动重新分配。根据预定义的条件,在重新定位之前可能会运行介质验证序列。
您可以使用 SMART 实用程序观察到发生这样的扇区重新分配,每个重新分配的扇区都会将“重新分配的扇区数”属性增加一(以 RAW 值表示)。