我正在运行带有 ZOL 版本的 Ubuntu 14.04 v0.6.5.4
:
root@box ~# dmesg | egrep "SPL|ZFS"
[ 34.430404] SPL: Loaded module v0.6.5.4-1~trusty
[ 34.475743] ZFS: Loaded module v0.6.5.4-1~trusty, ZFS pool version 5000, ZFS filesystem version 5
ZFS 在 6 个 2TB Seagate SpinPoint M9T 2.5 英寸驱动器的 raidz2 中配置,并启用读取缓存、重复数据删除和压缩:
root@box ~# zpool status -v
pool: bigpool
state: ONLINE
config:
NAME STATE READ WRITE CKSUM
bigpool ONLINE 0 0 0
raidz2-0 ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S34<redactedid> ONLINE 0 0 0
cache
sda3 ONLINE 0 0 0
每隔几天,盒子就会锁定,并且我会收到如下错误:
blk_update_request: I/O Error, dev sdh, sector 764218200
blk_update_request: I/O Error, dev sdf, sector 764218200
blk_update_request: I/O Error, dev sde, sector 764218200
blk_update_request: I/O Error, dev sdd, sector 764218200
blk_update_request: I/O Error, dev sdc, sector 764218432
blk_update_request: I/O Error, dev sdg, sector 764218200
smartctl 显示磁盘没有记录任何 SMART 错误,而且它们都是相当新的磁盘。我也觉得很奇怪,它们都在同一扇区上发生故障(sdc 除外)。我能够截取终端的屏幕截图(一旦错误开始,我就无法通过 ssh 登录):
这可能是控制器故障,或者是与 zfs 相关的错误?
答案1
您的控制器、电缆或背板存在问题。请注意所有驱动器如何同时受到影响...
我还建议不要在这样的设置上使用重复数据删除,除非绝对必要。