Azure VM 在重启时丢失 BGP 路由

Azure VM 在重启时丢失 BGP 路由

解决

带有 ExpressRoute 的 Azure。

我们有一组维护机器在晚上关闭以减少资源。几个月来一切都运行良好。昨天,我们发现几台机器无法访问。它们可以从其 Azure 子网内访问,但无法从网络上的其他地方访问。

经过一番故障排除后,我们发现他们丢失了所有正常显示在网络接口上的 BGP 路由。他们只有本地子网的 UDR。

我们有一个案件正在审理中,但目前正在互相指责。

所有正常工作的机器都有来自 BGP 的路由。情况变得更加紧急,因为昨晚一台生产机器重启了,现在又是同样的情况。

NIC 显示已连接到 VNet,并且连接到该 VNet 的其他 NIC 正在运行,有效路由显示来自 BGP 的路由。

我们尝试重新部署虚拟机,认为这可能是 Azure 主机问题,但没有成功。

答案1

问题解决了。

微软最终发现并承认前天晚上未沟通的更新在 5 个集群中引入了 NAT 问题,导致 BGP 路由传播到某些主机。

重新部署、新的 NIC 等均不起作用,因为我们正在移动到不同的主机或更改 NIC,但在相同的受影响集群中。

相关内容