我们在 Google Cloud Engine 上托管一个项目。集群和节点前有一个 TCP-LoadBalancer。一周以来,我们遇到了客户报告错误的问题:“与服务器的连接丢失”。
LoadBalancer 的 IP 上的 tpcdump:
# tcpdump -v host X.X.X.X | grep admin
p5B3805D8.dip0.t-ipconnect.de > X.X.X.X.bc.googleusercontent.com:
ICMP host `p5B3805D8.dip0.t-ipconnect.de unreachable - admin prohibited filter, length 36`
来自默认节点的 Iptables:
# iptables -nvL
Chain INPUT (policy ACCEPT 11 packets, 851 bytes)
pkts bytes target prot opt in out source destination
Chain FORWARD (policy ACCEPT 3 packets, 156 bytes)
pkts bytes target prot opt in out source destination
0 0 DOCKER all -- * docker0 0.0.0.0/0 0.0.0.0/0
0 0 ACCEPT all -- * docker0 0.0.0.0/0 0.0.0.0/0 ctstate RELATED,ESTABLISHED
0 0 ACCEPT all -- docker0 !docker0 0.0.0.0/0 0.0.0.0/0
0 0 ACCEPT all -- docker0 docker0 0.0.0.0/0 0.0.0.0/0
Chain OUTPUT (policy ACCEPT 8 packets, 2130 bytes)
pkts bytes target prot opt in out source destination
284M 104G KUBE-SERVICES all -- * * 0.0.0.0/0 0.0.0.0/0 /* kubernetes service portals */
Chain DOCKER (1 references)
pkts bytes target prot opt in out source destination
Chain KUBE-SERVICES (1 references)
pkts bytes target prot opt in out source destination
之后我检查了防火墙,但所有重要端口都允许,没有任何东西被丢弃。我们在整个集群上都收到了这些消息。有人建议我需要检查什么来解决这个问题吗?任何帮助都将不胜感激。