ZFS 重新同步设备且无错误

ZFS 重新同步设备且无错误

最近,我用一个更大的硬盘替换了客户站点备份服务器上的一个硬盘。它是在 HP SE326M1* 上运行的 freenas 盒。

当 ZFS 更换驱动器时,发生了大规模停电。

没有什么大问题——盒子再次启动,银化器也再次启动。

今天我发现了一件有趣的事:另一个驱动器也处于重新同步状态。但没有读/写/cksum 错误zpool status -v

  pool: Tank
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Mar  4 15:37:53 2017
        3.41T scanned out of 4.51T at 24.7M/s, 13h3m to go
        302G resilvered, 75.43% done
config:

    NAME                                            STATE     READ WRITE CKSUM
    Tank                                            ONLINE       0     0     0
      raidz2-0                                      ONLINE       0     0     0
        gptid/ad81fb87-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/b30f664d-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/09b6b651-ff29-11e6-9a6a-d8d385e6539a  ONLINE       0     0     0  (resilvering) <-- drive was replaced
        gptid/beb62f74-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/c2c97ff3-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
      raidz2-1                                      ONLINE       0     0     0
        gptid/41b1a629-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/4756cd8e-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/508e74c7-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/575939b3-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0  (resilvering) <-- drive in question
        gptid/5d914967-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0

errors: No known data errors

状态“(重新同步)”出现在最后几个小时 - 当第一个驱动器的重新同步正在进行中时。

有什么方法可以确定为什么第二个驱动器也重新镀银?为什么 ZFSgptid/575939b3-9785-11e6-894c-d8d385e6539a不管显示什么错误都显示重新镀银状态zpool status

--

*HP 服务器有一个 P410 RAID 控制器,采用直写模式。每个驱动器都配置为自己的 Raid-0

答案1

它再次发生了,这次我有日志。事实证明,用户 121391 完全正确,并且有问题的驱动器出现“无法重试”的错误。

Mar 12 08:22:14 freenas ciss0: *** Fatal drive error, Port=1I Box=1 Bay=14
Mar 12 08:22:14 freenas ciss0: (da9:ciss0:0:9:0): READ(10). CDB: 28 00 1b 50 ff 98 00 00 08 00 
Mar 12 08:22:14 freenas FATAL I/O ERROR on logical drive 9 (), SCSI port 0 ID 21
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): CAM status: SCSI Status Error
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI status: Check Condition
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI sense: MEDIUM ERROR asc:11,0 (Unrecovered read error)
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): Error 5, Unretryable error

看来,在出现此错误之后,RAID 控制器重新连接了驱动器,并触发了重新镀银。

相关内容