我在 ESX 4.0 机器上的 Windows Server 2008 R2 上运行 Windows 部署服务。这是此 VM 实例的唯一功能,尽管它之前曾用作 AD 域控制器。我的 DHCP 服务器在我们的主域控制器上运行,该控制器也是 Server 2008 R2,但在金属上运行。一切都运行良好,直到最近我们的备用发电机在停电期间发生故障,导致我们所有的服务器和网络设备在一段时间内断电。当我们将所有设备恢复后,一切都按预期运行除了用于 WDS。
我们的网络被分成几个不同的 VLAN。现在,根据客户端计算机所在的 VLAN,它在尝试 PXE 启动到 WDS 时的行为会有所不同。我们的服务器位于 10.55.xx VLAN 上,由于其性质,其中没有活动的 DHCP 服务器。我们插入的第一台计算机恰好位于 10.99.xx VLAN 中,该 VLAN 应该是为网络管理设备(即交换机)保留的,但我们偶尔会使用它。那台计算机给我们带来了 PXE-E11 ARP 超时错误。当我们移动到 10.19.xx VLAN 上的另一台计算机(用于一般用途)时,它最终从 DHCP 获得 IP,但它给我们带来了非常令人困惑的 PXE-E32 TFTP 打开超时错误。在断电之前,设备位于哪个 VLAN 并不重要;它可以正常进行 PXE 启动和映像。
我没有对服务器端的任何内容进行任何更改。所有配置都与断电前我的 WDS 和 DHCP 服务器上的配置完全相同。我尝试了几台不同的计算机,包括不同的型号。所有这些,再加上取决于 VLAN 的古怪行为,让我认为我们的一个或多个交换机出了问题,可能是由于断电造成的。不幸的是,我不是网络专家,我对如何正确配置我们的交换机知之甚少。
这是开关等的问题吗?如果是,我该如何解决?是否有我不知道的神奇选项?有人有什么预感吗?我几乎已经用尽了我的想法。
- 我们的主要交换机是 HP Procurve 5406。
- 我们还有 3 台 HP Procurve 4208 交换机。
- ESX 服务器是 HP ProLiant DL380 G6。
- WDS VM 当前正在使用 VMXNET3 网络适配器,但我们也尝试过 E1000 适配器。
答案1
这两个问题都是 HP 服务器上 PXE 引导加载程序中的错误(我自己在 ML150 和 DL360 上也见过),当它必须处理非 1500 MTU(即某处有中继)时。以下是我修复它的方法:
- 将 TFTP 配置中的最大块大小设置为 512 字节。
- 确保您的 DHCP 服务器向主机发送的最大 MTU 小于 1496。
- 关闭/打开机器(对我来说,通过 iLO 即可)。