访问家庭服务器上的某些位置会挂起/超时。我怎样才能找到原因并解决它?

访问家庭服务器上的某些位置会挂起/超时。我怎样才能找到原因并解决它?

从 Windows 访问这些位置超时或。在最坏的情况下,会挂起直到重新启动 smbd。通过 SSH 访问它们会挂起,直到连接关闭。我强力检查了 RAID5 阵列中的麻烦目录所在,但除了很多“范围树可能更窄”(据我所知,这并不严重)之外,没有发现任何内容。使用了 2.5T (73%) 的阵列,但我认为这不是问题。根据 /proc/loadavg,平均系统负载为 6.63 7.17 6.90,我认为不会那么大。直到大约两三周前也没有出现任何问题。

我在中找到了这个dmesg

[70920.276372] sd 8:0:0:0: [sdf] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[70920.276382] sd 8:0:0:0: [sdf] tag#0 Sense Key : Medium Error [current]
[70920.276387] sd 8:0:0:0: [sdf] tag#0 Add. Sense: Unrecovered read error
[70920.276395] sd 8:0:0:0: [sdf] tag#0 CDB: Read(10) 28 00 3f 14 00 f0 00 00 f0 00
[70920.276400] print_req_error: critical medium error, dev sdf, sector 1058275568

我如何找出导致问题的原因以及如何解决它?

答案1

根据 dmesg 的说法,该问题是由其中一个成员驱动器开始出现故障(扇区故障)引起的。移除故障驱动器后,阵列再次正常工作。

相关内容