ZFS 不断出现同一设备故障

ZFS 不断出现同一设备故障

我们的存储服务器出现了一些问题,就在不久前,我们的一个磁盘(WD 4TB RE SAS)坏了,尽管 raidcontroller(LSI MegaRAID 9271-8i) 使磁盘保持在线(状态:正常)。只有介质错误显示 1 个错误。我们决定保存并更换磁盘,在重新同步期间,第二块和第三块磁盘被标记为(重新同步),尽管只有一个磁盘显示 1 个读取错误。今天重新同步已完成(没有损坏,一切正常),我开始清理并遇到了以下问题:

zpool status
  pool: data
 state: DEGRADED
status: One or more devices could not be used because the label is missing or
        invalid.  Sufficient replicas exist for the pool to continue
        functioning in a degraded state.
action: Replace the device using 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-4J
  scan: scrub in progress since Thu Jan 14 10:50:00 2016
    2.71T scanned out of 111T at 718M/s, 43h59m to go
    0 repaired, 2.44% done
config:

        NAME                     STATE     READ WRITE CKSUM
        data                     DEGRADED     0     0     0
          raidz2-0               DEGRADED     0     0     0
            br0c2                ONLINE       0     0     0
            br1c2                ONLINE       0     0     0
            br2c2                ONLINE       0     0     0
            br0c3                ONLINE       0     0     0
            br1c3                ONLINE       0     0     0
            br2c3                ONLINE       0     0     0
            r2c1                 ONLINE       0     0     0
            r1c2                 ONLINE       0     0     0
            r5c3                 ONLINE       0     0     0
            sdb                  ONLINE       0     0     0
            sdc                  ONLINE       0     0     0
            7196084230607724634  FAULTED      0     0     0  was /dev/sdai1
            r5c0                 ONLINE       0     0     0
            r0c1                 ONLINE       0     0     0
            r1c1                 ONLINE       0     0     0
            r3c1                 ONLINE       0     0     0
            r4c1                 ONLINE       0     0     0
          raidz2-1               ONLINE       0     0     0
            r5c1                 ONLINE       0     0     0
            r0c2                 ONLINE       0     0     0
            r2c2                 ONLINE       0     0     0
            r3c2                 ONLINE       0     0     0
            r4c2                 ONLINE       0     0     0
            r5c2                 ONLINE       0     0     0
            r0c3                 ONLINE       0     0     0
            r1c3                 ONLINE       0     0     0
            r2c3                 ONLINE       0     0     0
            r3c3                 ONLINE       0     0     0
            r4c3                 ONLINE       0     0     0
            br0c0                ONLINE       0     0     0
            br1c0                ONLINE       0     0     0
            br2c0                ONLINE       0     0     0
            br0c1                ONLINE       0     0     0
            br1c1                ONLINE       0     0     0
            br2c1                ONLINE       0     0     0

errors: No known data errors

/dev/sdai1 处于在线状态,并且 raidcontroller 没有显示任何错误(甚至没有媒体错误)。我可以尝试将磁盘置于在线/离线状态吗?

更新:我尝试分离磁盘但是它拒绝这样做,我印象中 raidz2-0 有 2 个奇偶校验磁盘(并且 raidz2-1 也有 2 个)那么为什么我不能分离?

zpool detach data 7196084230607724634
cannot detach 7196084230607724634: only applicable to mirror and replacing vdevs

答案1

为什么要通过 RAID 控制器传递磁盘?使用 ZFS 时,JBOD 更有意义。您可以由于您的控制器而遇到问题。

无论如何,只需断开并重新连接磁盘即可。您也可以尝试更换磁盘(无需真正更换:zpool replace pool disk)

让它重新变银并再次擦洗。

相关内容