我正在尝试向 Cloudera 集群添加节点。当代理启动时,我收到一个 python 堆栈跟踪,提示无法向 master-host:7182 发送心跳,但我可以正常连接到该端口。
堆栈跟踪来自 Python,最后显示连接超时。
nc -z 1 -w master-host 7182
返回“连接成功”
防火墙已关闭,SELinux 处于宽容状态。
每个盒子有 2 个 IP,一个在 4 空间,一个在 8 空间。DNS 解析 8 地址,hosts 文件解析 4 地址。
编辑:添加更多信息,基于这个帖子:
- 操作系统版本相同,代理/管理器版本相同
- 我可以从 CM 主机连接到 4 个地址、端口 9000。4 个地址是 Cloudera Manager 上的主机页面中显示的地址
- 大型 ping 命令在 4 个地址上失败:
ping -c 3 -s 1800 4-address
,此接口的 MTU 设置为 9000。 - 大型 ping 命令传递 8 个地址,MTU 设置为 1500。
答案1
事实证明 MTU 似乎是问题所在——我们使用的基础设施不支持端到端巨型帧(在这种情况下,具有光纤互连的 Cisco c240m4s 需要通过 UCS 更新 QoS 设置)。