我们的监控脚本运行:
gluster volume status all
并解析输出,分析卷和砖块。最近,这里的一个 Gluster 服务器开始回复上述命令并出现错误:
另一笔交易正在进行中。请稍后重试。
是什么原因导致了这种情况?我该如何解决它?如果我完全重新启动 gluster 服务,这种情况可能会消失,但我们宁愿避免采取如此激烈的措施...有什么建议吗?
我们在 CentOS-6 上使用 gluster-3.6.2,通过 gluster.org 发布的 RPM 安装。谢谢!
答案1
根据network.frame-timeout
选项,1800 秒(30 分钟)后,“如果服务器没有响应特定操作,则必须声明操作已停止”(旧的,但可能仍然有效:http://www.gluster.org/community/documentation/index.php/Gluster_3.2:_Setting_Volume_Options#network.frame-timeout)。
日志中还可能包含宝贵的信息。