数据中心发生“电源事件”后网络无法连接

数据中心发生“电源事件”后网络无法连接

这是一个非常奇怪的问题,所以我将尽可能详细地说明。

我们的数据中心发生了“电源事件”(例如 PDU 故障),之后发生了几件糟糕的事情。首先,我们的 Cisco SG200-50 交换机丢失了配置并恢复为出厂默认设置,虽然我们的 5 台服务器中有 4 台确实恢复了正常运行,但有一台服务器无法连接到我们的公共或专用网络。该服务器上的两个 NIC 都显示“未识别网络”,虽然它们确实保留了分配的 IP(均为静态),但没有连接。

恢复交换机配置后,那台服务器也遇到了同样的问题。完全没有连接。在尝试了所有能想到的方法来恢复连接后,我们最终成功了,它可以 ping 通我们的本地网络,但不会使用该网卡上的网关,也无法访问互联网,网络仍然被识别为“未识别网络”

确定是网卡损坏了,所以换了一块新网卡。结果还是一样。新网卡还是无法连接到网络。

然后,我们通过交叉电缆将该服务器与我们的另一台服务器连接起来,该电缆在无法进行网络访问的 NIC 上工作正常。由于该服务器是 Hyper-V 主机,我们只需将 VPS 从该服务器复制到另一台主机,启动它们,然后完全清除该主机(甚至破坏 RAID 并重新创建它),然后重新安装 Windows(2012 R2 数据中心版)。经过所有这些...结果完全相同。原始 NIC 和新 NIC(以及重新安装后的 +1 替换)都无法连接到任何一个网络。我们还更换了 CAT 电缆并使用了不同的交换机端口,但都无济于事。

我现在唯一的猜测是主板有问题。这是一台较旧的服务器(Dell poweredge 2950),但没有任何迹象表明出现了问题 - 所有驱动程序都在加载,设备管理器中没有奇怪的设备,等等。我们尝试过的 NIC 来自不同的制造商,我们尝试了 CAT5 和 CAT 6 电缆。我们唯一还没有尝试过的是直接插入数据中心路由器,但我确实正在处理这件事 - 这需要一段时间,因为我们有一个来自数据中心的特殊路由端口,我猜他们要设置另一个这样的端口真是太麻烦了。但我非常怀疑这能否解决问题,因为同一台交换机上的其他服务器连接良好,没有任何问题。

无论如何……我希望这里的一位专家以前见过类似的东西,并能对此提供一些解释。任何信息都非常感谢!

相关内容