Google Compute 上的 Elasticsearch - 网络问题

Google Compute 上的 Elasticsearch - 网络问题

我刚刚将我的集群从 AWS EC2 移至 Google Compute,查看日志发现似乎存在持续的网络问题。

这种情况会在两个特定节点上发生,每天发生几次。

它以错误开始:

master left (reason = failed to ping, tried [3] times, each with maximum [30s] timeout), current nodes: nodes:

检查日志似乎并没有重新启动(使用 docker 运行),只是断开连接并重新连接。

网络选项卡VM instance details并不是那么有用。

答案1

为了防止有人遇到这种情况,我们最终解决了这个问题。

(1) 显然,在 Google Compute 中,连接会在 10 分钟后断开,这个时间相当短(ubuntu 的默认保持 ping 时间为 2 小时)。来源是这里。他们甚至在这个链接中推荐了实际使用的值,这些值低于我们最初尝试的值。

(2) 我们遇到的另一个问题是,docker 需要它自己对 sysctl 的定义,因此更改 ubuntu 的配置实际上没有任何作用。

五天里我们没有出现过一次断线的情况。

相关内容