这个 RAID-1 磁盘会导致系统挂起吗?

这个 RAID-1 磁盘会导致系统挂起吗?

背景

我有一台 Windows 10 桌面,其中安装了几个不同的磁盘/文件系统:

  • 1TB SSD,主要/Windows 安装在此处
  • 500GB SSD,辅助,用于虚拟机
  • 120GB SSD,辅助,用于安装游戏
  • 4TB RAID-1(2x4TB Seagate HDD),辅助媒体存储
  • 2TB RAID-1(2x2TB WD HDD),辅助媒体存储

我认为问题在于 2TB RAID 卷。最近发生的事情是,如果我浏览/访问此文件系统,它最终会完全挂起。甚至无法结束挂起的进程,甚至无法正常关闭计算机(我甚至没有看到 BSOD;系统基本上卡住了,直到我进行硬重启)。我仍然可以移动鼠标并与预先存在的程序交互(只要它们不是尝试访问该卷(我猜)。

这不会立即发生,但如果我浏览几个不同的文件夹或尝试向其中复制大量新数据(从 4TB 卷),这似乎足以触发它。

所以无论如何,我假设问题出在卷上(它还使用了系统中两个最旧的硬盘)。虽然我可能错了;如果有其他解释,我很高兴听到这个问题的其他解释。

问题

我安装了一个SMART 检查器实用程序并检查了可疑阵列中的磁盘。两个磁盘都通过了“简短自检”。其中一个磁盘的属性报告如下:

驱动器-1

...另一个看起来像:

驱动器-1

虽然第二张磁盘确实显示了非零的“原始读取错误率”和更大的“多区域错误率”,但似乎没有太大的差异。

这些错误是否可能导致系统在访问此 RAID 卷时挂起?我应该出去买一个替换磁盘吗?

更新(来自评论)

RAID 使用华硕 B360M-K 主板提供的集成控制器。以下是设备管理器屏幕截图:

在此处输入图片描述

系统事件日志中唯一明显的内容是几条“已发出重置至设备 \Device\RaidPort1”的消息。

答案1

硬盘的默认设置是发生错误时重试,因为数据仍有可能恢复。磁盘将在成功读取后返回数据,或在(长时间)超时后报告错误。在 RAID 组中,您应该重新配置各个磁盘以立即报告错误并且永不重试,这样 RAID 控制器就可以从另一个磁盘获取数据并立即重写不可读的扇区。

当磁盘正确报告错误时,RAID 控制器可以决定是否将磁盘标记为故障,它通常在磁盘报告写入扇区错误时执行此操作(因为那时它已经用完了重新映射扇区),并且如果您的磁盘确实很糟糕,它会很快达到该状态。

您应该定期进行只读检查,读取所有扇区并验证其校验和,我通常以 14 天为一个周期运行这些检查。

相关内容