背景
我有一台 Windows 10 桌面,其中安装了几个不同的磁盘/文件系统:
- 1TB SSD,主要/Windows 安装在此处
- 500GB SSD,辅助,用于虚拟机
- 120GB SSD,辅助,用于安装游戏
- 4TB RAID-1(2x4TB Seagate HDD),辅助媒体存储
- 2TB RAID-1(2x2TB WD HDD),辅助媒体存储
我认为问题在于 2TB RAID 卷。最近发生的事情是,如果我浏览/访问此文件系统,它最终会完全挂起。甚至无法结束挂起的进程,甚至无法正常关闭计算机(我甚至没有看到 BSOD;系统基本上卡住了,直到我进行硬重启)。我仍然可以移动鼠标并与预先存在的程序交互(只要它们不是还尝试访问该卷(我猜)。
这不会立即发生,但如果我浏览几个不同的文件夹或尝试向其中复制大量新数据(从 4TB 卷),这似乎足以触发它。
所以无论如何,我假设问题出在卷上(它还使用了系统中两个最旧的硬盘)。虽然我可能错了;如果有其他解释,我很高兴听到这个问题的其他解释。
问题
我安装了一个SMART 检查器实用程序并检查了可疑阵列中的磁盘。两个磁盘都通过了“简短自检”。其中一个磁盘的属性报告如下:
...另一个看起来像:
虽然第二张磁盘确实显示了非零的“原始读取错误率”和更大的“多区域错误率”,但似乎没有太大的差异。
这些错误是否可能导致系统在访问此 RAID 卷时挂起?我应该出去买一个替换磁盘吗?
更新(来自评论)
RAID 使用华硕 B360M-K 主板提供的集成控制器。以下是设备管理器屏幕截图:
系统事件日志中唯一明显的内容是几条“已发出重置至设备 \Device\RaidPort1”的消息。
答案1
硬盘的默认设置是发生错误时重试,因为数据仍有可能恢复。磁盘将在成功读取后返回数据,或在(长时间)超时后报告错误。在 RAID 组中,您应该重新配置各个磁盘以立即报告错误并且永不重试,这样 RAID 控制器就可以从另一个磁盘获取数据并立即重写不可读的扇区。
当磁盘正确报告错误时,RAID 控制器可以决定是否将磁盘标记为故障,它通常在磁盘报告写入扇区错误时执行此操作(因为那时它已经用完了重新映射扇区),并且如果您的磁盘确实很糟糕,它会很快达到该状态。
您应该定期进行只读检查,读取所有扇区并验证其校验和,我通常以 14 天为一个周期运行这些检查。