触摸 ZFS 卷导致操作系统冻结,驱动器报告正常

触摸 ZFS 卷导致操作系统冻结,驱动器报告正常

我刚买的 4 个全新 3TB WD Red 硬盘出现了很多问题。尝试在 ubuntu 14.04.1 上使用“本机 zfs”为所有 4 个硬盘设置 raidz2,一开始可以正常工作,直到我开始尝试将数据复制到已安装的卷。

我在所有 4 个驱动器上运行了坏块,一切正常。我在所有 4 个驱动器上运行了 SMART 扩展测试,一切正常。

我认为可能是 idle3 计时器可能导致了问题,因为我确实注意到驱动器经常进入睡眠状态,即使在我尝试将数据复制到它们时(wtf?)所以我抓住了 wd5741 工具,如果我没记错的话,它没有用,但 idle3-tools 成功阻止了驱动器进入待机状态 - 永远。

到目前为止,syslog 仍然报告类似以下错误:

ata7.00: exception Emask 0x10 SAct 0x0 SErr 0x1910000 action 0xe frozen
ata7: SError: { PHYRdyChg Dispar LinkSeq TrStaTrns }
ata7.00: failed command: READ DMA

end_request: I/O error, dev sdc, sector 377981880

ata5.00: device reported invalid CHS sector 0

ata6.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
ata6.00: failed command: WRITE DMA EXT

对于所有 4 个卷、ata5-8 和 /dev/sdc-f,当访问这些驱动器的进程开始锁定时。

一旦这些驱动器锁定,接触它们的任何进程都将被锁定,即使只是尝试列出卷的目录内容(最近未列出的目录内容)也会冻结。

只有 2 个驱动器曾经报告过“WRITE DMA EXT”错误,但我怀疑这是因为设备“忙”(正在做一些我无法检测也无法停止的事情)而不得不强制重置机器。

我检查过的其他线程发现大多数人都是通过更换驱动器来解决问题,但他们通过 SMART 检查发现错误 - 而我没有。

为了解决这个问题,我不得不销毁并重新创建 ZFS 池大约 5 次。使用最少的软件重新安装了一次 ubuntu 服务器。

经过两天的努力,想法已经所剩无几了……

更新:连夜将副本运行到 ZFS 池,其中 2 个驱动器尚未出现任何写入问题。它冻结了。我看不到它何时复制或复制了多少,因为当我尝试运行lssudo mount几乎任何东西时,我都会收到文件未找到错误。因此,除非内核决定卸载系统驱动器是个好主意,否则我会说我的 SATA 控制器坏了,这意味着主板可能即将出故障。话虽如此,我今天早上确实发现它至少有 5 年的历史了,其中 2 年是全天候运行的,所以可能是时候更换它了 :( 我会在此帖子中更新任何其他新闻。

答案1

事实证明我的 SATA 控制器确实坏了。我已更换了所有能更换的部件,但即使在启动时,有时也检测不到驱动器是否已连接,因此很难指出其他问题。

感谢那些发表评论并试图提供帮助的人:)

相关内容