通过 MPLS 与主机的连接问题

通过 MPLS 与主机的连接问题

有关 VMware 的原始线程供参考:https://communities.vmware.com/thread/490718

你好,

我们一直在排除导致 vCenter 服务器无法连接到某些远程主机的问题。这影响了在 Windows Server 2008 R2 和 2012 R2 上运行 5.1 和 5.5 的 2 个不同的 vCenter 服务器。

导致错误的流程

  • 我们可以在主机重启或全新安装 vCenter 后将主机添加到数据中心
  • 如果我们的主数据中心 MPLS 发生故障(维护或其他原因),我们将失去与所有远程主机的连接
  • 一个数据中心能够重新连接,没有任何问题。这个特定的数据中心是我们的辅助数据中心
  • 其他远程站点均无法重新连接

故障排除

  • 在 VMware 基础架构(Windows 服务器、ESXi 主机)中禁用 IPv6
  • 将 handshakeTimeoutMs 增加至 120000
  • 重启管理网络
  • 清除 ARP 表
  • 锁定模式已禁用
  • 禁用网络上的代理 ARP

笔记

我们有一台 ESX 4.1 主机,可以重新连接,不会出现问题(只出现过一次断开连接,但与 5.5 主机不同,重新连接后没有出现问题)我们能够通过 vSphere 客户端和 SSH 连接到主机,不会出现问题网络团队也在排除此问题,但我们还不能排除 VMware 是罪魁祸首的可能性

日志

vpxd 2014-09-24T14:00:14.785-05:00 [05920 警告“默认”] 无法连接套接字;,>,e:system:10060(由于连接方在一段时间后未正确响应,或由于连接的主机未响应,导致连接尝试失败)

2014-09-24T14:00:14.785-05:00 [05920 错误‘HttpConnectionPool-000001’] [ConnectComplete] 连接失败;cnx:(null),错误:类 Vmacore::SystemException(连接尝试失败,因为连接方在一段时间后没有正确响应,或者建立连接失败,因为连接的主机未能响应)

2014-09-24T14:00:14.785-05:00 [05852 错误‘httphttpUtil’opID = 6159800D-000000AB-d6] [HttpUtil :: ExecuteRequest]发送请求时出错 - 连接尝试失败,因为连接方在一段时间后未正确响应,或者建立连接失败,因为连接的主机未能响应

2014-09-24T14:00:14.785-05:00 [05852 错误‘vpxdvpxdHostAccess’opID=6159800D-000000AB-d6] [VpxdHostAccess::Connect] 无法发现版本:vim.fault.HttpFault

2014-09-24T14:00:14.786-05:00 [05852 信息‘commonvpxLro’opID=6159800D-000000AB-d6] [VpxLRO] -- 完成任务内部-5070 -- 数据中心-31 -- vim.Datacenter.queryConnectionInfo --

2014-09-24T14:00:14.786-05:00 [05852 信息‘默认’opID=6159800D-000000AB-d6] [VpxLRO] -- 错误任务内部-5070 -- 数据中心-31 -- vim.Datacenter.queryConnectionInfo: vim.fault.NoHost:

--> 结果:

-->(vim.fault.NoHost){

--> 动态类型 = ,

-->faultCause = (vmodl.MethodFault) null,

--> 名称 = “xxxesxi01.xxx.com”

--> 消息 = "",

--> }

--> 参数:

-->

连接错误 在 vCenter Server“VCENTER”上对对象“XXX”调用“Datacenter.QueryConnectionInfo”失败。

谢谢

相关内容