我们正在使用 GlusterFS 3.7.11 进行分布式/复制卷。最初,卷由 4 块砖组成,每块砖位于一个专用节点上。我们在设计中添加了 4 个节点,为了扩展卷容量,我们添加了 4 块砖(每块砖位于一个新添加的节点上),因此最终卷有 8 块砖(4 x 2 - 副本 2)。就最佳实践而言,建议通过首先修复布局然后迁移数据来重新平衡卷,因此我开始修复布局,几个小时后修复布局成功完成。尝试迁移数据时,重新平衡任务在短短几秒钟后失败。有关重新平衡失败的崩溃报告如下:
pending frames:
frame : type(0) op(0)
frame : type(0) op(0)
frame : type(0) op(0)
patchset: git://git.gluster.com/glusterfs.git
signal received: 4
time of crash:
2016-06-08 01:03:09
configuration details:
argp 1
backtrace 1
dlfcn 1
libpthread 1
llistxattr 1
setfsid 1
spinlock 1
epoll.h 1
xattr.h 1
st_atim.tv_nsec 1
package-string: glusterfs 3.7.11
/usr/lib/x86_64-linux- gnu/libglusterfs.so.0(_gf_msg_backtrace_nomem+0x92)[0x7fb81f1d75e2]
/usr/lib/x86_64-linux-gnu/libglusterfs.so.0(gf_print_trace+0x31d) [0x7fb81f1f36cd]
/lib/x86_64-linux-gnu/libc.so.6(+0x36cb0)[0x7fb81e5d5cb0]
/lib/x86_64-linux-gnu/libpthread.so.0(+0x11f3b)[0x7fb81e975f3b]
/usr/lib/x86_64-linux-gnu/libglusterfs.so.0(inode_ref+0x19)[0x7fb81f1f7e99]
/usr/lib/x86_64-linux-gnu/libglusterfs.so.0(loc_copy+0x4a)[0x7fb81f1d59ca]
/usr/lib/x86_64-linux- gnu/glusterfs/3.7.11/xlator/cluster/distribute.so(dht_local_init+0x4b) [0x7fb8194d38db]
/usr/lib/x86_64-linux- gnu/glusterfs/3.7.11/xlator/cluster/distribute.so(dht_lookup+0x91)[0x7fb8195087d1]
/usr/lib/x86_64-linux-gnu/libglusterfs.so.0(syncop_lookup+0x1a2)[0x7fb81f21c102]
/usr/lib/x86_64-linux-gnu/glusterfs/3.7.11/xlator/cluster/distribute.so(gf_defrag_fix_layout+0x89)[0x7fb8194db6c9]
/usr/lib/x86_64-linux-gnu/glusterfs/3.7.11/xlator/cluster/distribute.so(gf_defrag_start_crawl+0x469)[0x7fb8194dd059]
/usr/lib/x86_64-linux-gnu/libglusterfs.so.0(synctask_wrap+0x12)[0x7fb81f218972]
/lib/x86_64-linux-gnu/libc.so.6(+0x49800)[0x7fb81e5e8800]
我真的不知道问题出在哪里...,我真的很感激对此事的一些意见。
谢谢,N