背景

Question 1

目前：Xen 下的小数据包性能很差

（从问题本身移至单独的答案）

据 HN 上的一位用户（KVM 开发人员？）称，这是由于 Xen 和 KVM 中的小数据包性能所致。这是虚拟化的一个已知问题，据他所说，VMWare 的 ESX 处理这个问题要好得多。他还指出，KVM 正在引入一些旨在缓解这个问题的新功能（原始帖子）。

如果这些信息正确的话，那有点令人沮丧。无论如何，我会尝试以下步骤，直到一些 Xen 专家给出明确的答案 :)

xen-users 邮件列表的 Iain Kay 编制了此图表： netperf 图注意 TCP_CRR 条，比较“2.6.18-239.9.1.el5”与“2.6.39 (带有 Xen 4.1.0)”。

当前行动计划基于此处和以下来源的回复/答案氢：

按照 syneticon-dj A~~的建议，将此问题提交给 Xen 特定的邮件列表和 xensource 的 bugzilla~~消息已发布到 xen-user 列表，等待回复。
~~创建一个简单的病理性应用程序级测试用例并发布。~~
已创建带有说明的测试服务器，发布到 GitHub. 通过这个，你应该能够看到与 netperf 相比更真实的用例。
~~尝试 32 位 PV Xen 客户实例，因为 64 位可能会导致 Xen 产生更多开销。有人在 HN 上提到了这一点。~~没什么区别。
~~尝试按照 HN 上的 abofh 的建议在 sysctl.conf 中启用 net.ipv4.tcp_syncookies。这显然可能提高性能，因为握手将发生在内核中。~~我在这方面没有运气。
将积压量从 1024 增加到更高的值，这也是 abofh 在 HN 上提出的建议。这也可能有帮助，因为客户机在由 dom0（主机）提供的执行片段中可能会 accept() 更多连接。
~~仔细检查所有机器上的 conntrack 是否已禁用，因为它会使接受率减半（由 deubeulyou 建议）。~~是的，它在所有测试中均已禁用。
检查“netstat -s 中的监听队列溢出和同步缓存桶溢出”（由 HN 上的 mike_esspe 建议）。
将中断处理拆分到多个核心之间（我之前尝试启用的 RPS/RFS 应该可以做到这一点，但可能值得再试一次）。由 HN 的 adamt 建议。
按照 Matt Bailey 的建议关闭 TCP 分段卸载和分散/聚集加速。（在 EC2 或类似的 VPS 主机上无法实现）

Answer

目前：Xen 下的小数据包性能很差

（从问题本身移至单独的答案）

据 HN 上的一位用户（KVM 开发人员？）称，这是由于 Xen 和 KVM 中的小数据包性能所致。这是虚拟化的一个已知问题，据他所说，VMWare 的 ESX 处理这个问题要好得多。他还指出，KVM 正在引入一些旨在缓解这个问题的新功能（原始帖子）。

如果这些信息正确的话，那有点令人沮丧。无论如何，我会尝试以下步骤，直到一些 Xen 专家给出明确的答案 :)

xen-users 邮件列表的 Iain Kay 编制了此图表： netperf 图注意 TCP_CRR 条，比较“2.6.18-239.9.1.el5”与“2.6.39 (带有 Xen 4.1.0)”。

当前行动计划基于此处和以下来源的回复/答案氢：

按照 syneticon-dj A~~的建议，将此问题提交给 Xen 特定的邮件列表和 xensource 的 bugzilla~~消息已发布到 xen-user 列表，等待回复。
~~创建一个简单的病理性应用程序级测试用例并发布。~~
已创建带有说明的测试服务器，发布到 GitHub. 通过这个，你应该能够看到与 netperf 相比更真实的用例。
~~尝试 32 位 PV Xen 客户实例，因为 64 位可能会导致 Xen 产生更多开销。有人在 HN 上提到了这一点。~~没什么区别。
~~尝试按照 HN 上的 abofh 的建议在 sysctl.conf 中启用 net.ipv4.tcp_syncookies。这显然可能提高性能，因为握手将发生在内核中。~~我在这方面没有运气。
将积压量从 1024 增加到更高的值，这也是 abofh 在 HN 上提出的建议。这也可能有帮助，因为客户机在由 dom0（主机）提供的执行片段中可能会 accept() 更多连接。
~~仔细检查所有机器上的 conntrack 是否已禁用，因为它会使接受率减半（由 deubeulyou 建议）。~~是的，它在所有测试中均已禁用。
检查“netstat -s 中的监听队列溢出和同步缓存桶溢出”（由 HN 上的 mike_esspe 建议）。
将中断处理拆分到多个核心之间（我之前尝试启用的 RPS/RFS 应该可以做到这一点，但可能值得再试一次）。由 HN 的 adamt 建议。
按照 Matt Bailey 的建议关闭 TCP 分段卸载和分散/聚集加速。（在 EC2 或类似的 VPS 主机上无法实现）

Question 2

有趣的是，我发现关闭 NIC 硬件加速可以极大地提高 Xen 控制器上的网络性能（对于 LXC 也是如此）：

分散-聚集加速度：

/usr/sbin/ethtool -K br0 sg off

TCP 分段卸载：

/usr/sbin/ethtool -K br0 tso off

其中 br0 是虚拟机管理程序主机上的桥接器或网络设备。您必须将其设置为在每次启动时将其关闭。YMMV。

Answer

有趣的是，我发现关闭 NIC 硬件加速可以极大地提高 Xen 控制器上的网络性能（对于 LXC 也是如此）：

分散-聚集加速度：

/usr/sbin/ethtool -K br0 sg off

TCP 分段卸载：

/usr/sbin/ethtool -K br0 tso off

其中 br0 是虚拟机管理程序主机上的桥接器或网络设备。您必须将其设置为在每次启动时将其关闭。YMMV。

Question 3

也许您可以稍微澄清一下 - 您是在自己的服务器上的 Xen 下运行测试，还是仅在 EC2 实例上运行？

Accept 只是另一个系统调用，新连接的唯一不同之处在于前几个数据包将具有一些特定标志 - 虚拟机管理程序（如 Xen）绝对不会看到任何差异。您的设置的其他部分可能：例如在 EC2 中，如果安全组与它有关，我不会感到惊讶；conntrack 也是据报道，新连接接受率减半（PDF）。

最后，似乎存在一些 CPU/内核组合，会导致 EC2（可能还有 Xen）出现奇怪的 CPU 使用率/挂断现象，例如Librato 最近在博客中提到。

Answer

也许您可以稍微澄清一下 - 您是在自己的服务器上的 Xen 下运行测试，还是仅在 EC2 实例上运行？

Accept 只是另一个系统调用，新连接的唯一不同之处在于前几个数据包将具有一些特定标志 - 虚拟机管理程序（如 Xen）绝对不会看到任何差异。您的设置的其他部分可能：例如在 EC2 中，如果安全组与它有关，我不会感到惊讶；conntrack 也是据报道，新连接接受率减半（PDF）。

最后，似乎存在一些 CPU/内核组合，会导致 EC2（可能还有 Xen）出现奇怪的 CPU 使用率/挂断现象，例如Librato 最近在博客中提到。

Question 4

确保在 dom0 中的桥接代码中禁用了 iptables 和其他钩子。显然，它仅适用于桥接网络 Xen 设置。

echo 0 > /proc/sys/net/bridge/bridge-nf-call-ip6tables
echo 0 > /proc/sys/net/bridge/bridge-nf-call-iptables
echo 0 > /proc/sys/net/bridge.bridge-nf-call-arptables

这取决于服务器的大小，但在较小的服务器（4 核处理器）上，将一个 CPU 核心专用于 Xen dom0 并固定它。虚拟机管理程序启动选项：

dom0_max_vcpus=1 dom0_vcpus_pin dom0_mem=<at least 512M>

您是否尝试过将物理以太网 PCI 设备传递到 domU？性能应该会大幅提升。

Answer

确保在 dom0 中的桥接代码中禁用了 iptables 和其他钩子。显然，它仅适用于桥接网络 Xen 设置。

echo 0 > /proc/sys/net/bridge/bridge-nf-call-ip6tables
echo 0 > /proc/sys/net/bridge/bridge-nf-call-iptables
echo 0 > /proc/sys/net/bridge.bridge-nf-call-arptables

这取决于服务器的大小，但在较小的服务器（4 核处理器）上，将一个 CPU 核心专用于 Xen dom0 并固定它。虚拟机管理程序启动选项：

dom0_max_vcpus=1 dom0_vcpus_pin dom0_mem=<at least 512M>

您是否尝试过将物理以太网 PCI 设备传递到 domU？性能应该会大幅提升。

背景

背景

重现此行为

我怎么知道这个问题不是由于软件编写不佳造成的？

为什么这很重要？

更新 1

答案1

目前：Xen 下的小数据包性能很差

当前行动计划基于此处和以下来源的回复/答案氢：

答案2

答案3

答案4

相关内容