最近,我用一个更大的硬盘替换了客户站点备份服务器上的一个硬盘。它是在 HP SE326M1* 上运行的 freenas 盒。
当 ZFS 更换驱动器时,发生了大规模停电。
没有什么大问题——盒子再次启动,银化器也再次启动。
今天我发现了一件有趣的事:另一个驱动器也处于重新同步状态。但没有读/写/cksum 错误zpool status -v
pool: Tank
state: ONLINE
status: One or more devices is currently being resilvered. The pool will
continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
scan: resilver in progress since Sat Mar 4 15:37:53 2017
3.41T scanned out of 4.51T at 24.7M/s, 13h3m to go
302G resilvered, 75.43% done
config:
NAME STATE READ WRITE CKSUM
Tank ONLINE 0 0 0
raidz2-0 ONLINE 0 0 0
gptid/ad81fb87-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
gptid/b30f664d-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
gptid/09b6b651-ff29-11e6-9a6a-d8d385e6539a ONLINE 0 0 0 (resilvering) <-- drive was replaced
gptid/beb62f74-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
gptid/c2c97ff3-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
raidz2-1 ONLINE 0 0 0
gptid/41b1a629-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
gptid/4756cd8e-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
gptid/508e74c7-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
gptid/575939b3-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0 (resilvering) <-- drive in question
gptid/5d914967-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
errors: No known data errors
状态“(重新同步)”出现在最后几个小时 - 当第一个驱动器的重新同步正在进行中时。
有什么方法可以确定为什么第二个驱动器也重新镀银?为什么 ZFSgptid/575939b3-9785-11e6-894c-d8d385e6539a
不管显示什么错误都显示重新镀银状态zpool status
?
--
*HP 服务器有一个 P410 RAID 控制器,采用直写模式。每个驱动器都配置为自己的 Raid-0
答案1
它再次发生了,这次我有日志。事实证明,用户 121391 完全正确,并且有问题的驱动器出现“无法重试”的错误。
Mar 12 08:22:14 freenas ciss0: *** Fatal drive error, Port=1I Box=1 Bay=14
Mar 12 08:22:14 freenas ciss0: (da9:ciss0:0:9:0): READ(10). CDB: 28 00 1b 50 ff 98 00 00 08 00
Mar 12 08:22:14 freenas FATAL I/O ERROR on logical drive 9 (), SCSI port 0 ID 21
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): CAM status: SCSI Status Error
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI status: Check Condition
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI sense: MEDIUM ERROR asc:11,0 (Unrecovered read error)
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): Error 5, Unretryable error
看来,在出现此错误之后,RAID 控制器重新连接了驱动器,并触发了重新镀银。