Cloudera SCM 代理无法心跳但端口可联系

Cloudera SCM 代理无法心跳但端口可联系

我正在尝试向 Cloudera 集群添加节点。当代理启动时,我收到一个 python 堆栈跟踪,提示无法向 master-host:7182 发送心跳,但我可以正常连接到该端口。

堆栈跟踪来自 Python,最后显示连接超时。

nc -z 1 -w master-host 7182返回“连接成功”

防火墙已关闭,SELinux 处于宽容状态。

每个盒子有 2 个 IP,一个在 4 空间,一个在 8 空间。DNS 解析 8 地址,hosts 文件解析 4 地址。

编辑:添加更多信息,基于这个帖子

  • 操作系统版本相同,代理/管理器版本相同
  • 我可以从 CM 主机连接到 4 个地址、端口 9000。4 个地址是 Cloudera Manager 上的主机页面中显示的地址
  • 大型 ping 命令在 4 个地址上失败:ping -c 3 -s 1800 4-address,此接口的 MTU 设置为 9000。
  • 大型 ping 命令传递 8 个地址,MTU 设置为 1500。

答案1

事实证明 MTU 似乎是问题所在——我们使用的基础设施不支持端到端巨型帧(在这种情况下,具有光纤互连的 Cisco c240m4s 需要通过 UCS 更新 QoS 设置)。

相关内容