Active/Active 配置中的 ESXi VMKernel 端口有什么问题？

Question 1

ESXI 中的管理 vmk 在初始设置期间假定第一个 PCI 插槽中 Nic 的 MAC 地址。这就是它一直的工作方式。只有当物理设备也开始发送数据包时，这才会破坏设备。这通常不会发生，物理 Nic 不会发送流量，它们会传递流量。如果您决定将物理 Nic 从一个主机移动到另一个主机，也需要注意此行为，当物理交换机出现故障时，这会导致 2 个主机连接中断。我猜这个 Nic 开始报告 CDP/LLDP 流量，这时您的交换机就会看到 MAC 重复。最简单的解决方案是通过命令行重建 vmk。这需要从直接控制台访问 (DCUI)（KVM、ILO、IDRAC 等...）完成。

以下是命令；（调整 IP/子网掩码/端口组名称等...以满足您的需要。）

esxcli 网络 ip 接口删除 --interface-name=vmk0

esxcli 网络 vswitch 标准端口组添加 -p Management_Network -v vSwitch0

esxcli 网络 ip 接口添加 --interface-name=vmk0 --portgroup-name=Management_Network

esxcli 网络 vswitch 标准端口组设置 -p Management_Network --vlan-id 50

esxcli 网络 ip 接口 ipv4 设置 --interface-name=vmk0 --ipv4=192.168.50.116 --netmask=255.255.255.0 --gateway=192.168.50.1 --type=static

esxcli 网络 ip 接口标签添加 -i vmk0 -t 管理

这将使用 VMware MAC 地址重建管理 vmk 以消除此问题。但是，我建议您联系硬件供应商/制造商，以关闭来自物理卡的 CDP/LLDP。这将解决这个 ESXi 主机问题，但如果您允许卡继续执行此功能，最终会导致其他主机也出现此问题。如果这个问题像您最初想象的那么大，VMware 就不会是一家大公司了，这种情况并不常见……

Answer

ESXI 中的管理 vmk 在初始设置期间假定第一个 PCI 插槽中 Nic 的 MAC 地址。这就是它一直的工作方式。只有当物理设备也开始发送数据包时，这才会破坏设备。这通常不会发生，物理 Nic 不会发送流量，它们会传递流量。如果您决定将物理 Nic 从一个主机移动到另一个主机，也需要注意此行为，当物理交换机出现故障时，这会导致 2 个主机连接中断。我猜这个 Nic 开始报告 CDP/LLDP 流量，这时您的交换机就会看到 MAC 重复。最简单的解决方案是通过命令行重建 vmk。这需要从直接控制台访问 (DCUI)（KVM、ILO、IDRAC 等...）完成。

以下是命令；（调整 IP/子网掩码/端口组名称等...以满足您的需要。）

esxcli 网络 ip 接口删除 --interface-name=vmk0

esxcli 网络 vswitch 标准端口组添加 -p Management_Network -v vSwitch0

esxcli 网络 ip 接口添加 --interface-name=vmk0 --portgroup-name=Management_Network

esxcli 网络 vswitch 标准端口组设置 -p Management_Network --vlan-id 50

esxcli 网络 ip 接口 ipv4 设置 --interface-name=vmk0 --ipv4=192.168.50.116 --netmask=255.255.255.0 --gateway=192.168.50.1 --type=static

esxcli 网络 ip 接口标签添加 -i vmk0 -t 管理

这将使用 VMware MAC 地址重建管理 vmk 以消除此问题。但是，我建议您联系硬件供应商/制造商，以关闭来自物理卡的 CDP/LLDP。这将解决这个 ESXi 主机问题，但如果您允许卡继续执行此功能，最终会导致其他主机也出现此问题。如果这个问题像您最初想象的那么大，VMware 就不会是一家大公司了，这种情况并不常见……

Question 2

我已经运行了极为相似的设置很多年了，没有任何问题。

您如何配置交换机端口？您不应该做任何特别的事情（不(M)LAG/LACP)，因为 ESXi 会处理所有事情。堆叠交换机没问题，只是不要聚合端口，配置任何链路状态镜像或类似功能。

Switch2 应该永久地在面向 ESXi 的端口上具有 VMkernel 端口的 MAC，并且 switch1 应该永久地在面向 switch2 的端口上具有 VMkernel 端口的 MAC。

MAC 来回抖动可能是由其他问题引起的，例如频繁的 STP 拓扑更改（ESXi 通常看不到，但仍可能看到）。检查交换机的日志是否有任何异常。

问题在于为什么交换机 1 会定期获取 ESXi VMKernel 端口的 MAC 地址。

没有任何 LAG，只有当主机实际将带有 VMK 端口 MAC 的帧发送到交换机 1 时才会发生这种情况。除非到交换机 2 的链接发生故障，否则它通常不会这样做。

连接到交换机 1 的接口应该处于非活动状态。

对于 VMK 端口，是的。可能有 VM 流量连接到同一端口组。

但是，看起来它可能正在响应 ARP 请求？

无论是否是 ARP，具有 VMK 端口 MAC 的帧都不会无缘无故地从其他端口发出。

Answer