当大量使用 RAM 时，服务器计算速度会减慢

Question

我建议启用 numad 服务：

yum install numad
systemctl enable numad
systemctl start numad

numad 应该能够自动处理内存局部性。进程在第一个 NUMA 节点的 CPU 上运行，但其数据在第二个 NUMA 节点本地的 RAM 中的情况应该不再发生（除非所需内存量大于单个 NUMA 节点本地 RAM 的容量）。

我还建议使用最适合您使用场景的配置文件来配置经过调整的服务。您必须衡量差异并选择最佳的（或者您可以创建一些自定义的）。

也许我已经找到你节点上出现奇怪行为的原因了。我搜索了 mpirun 并找到了手册页：

https://www.open-mpi.org/doc/current/man1/mpirun.1.php

有记载：

快速摘要

如果您只是想知道如何运行 MPI 应用程序，那么您可能想要使用以下形式的命令行：% mpirun [ -np X ] [ --hostfile ] 这将在您当前的运行时环境中运行 X 个副本（如果在受支持的资源管理器下运行，Open MPI 的 mpirun 通常会自动使用相应的资源管理器进程启动器，而不是例如 rsh 或 ssh，它们需要使用主机文件，或者默认在本地主机上运行所有 X 个副本），默认情况下按 CPU 插槽以循环方式进行调度。有关更多详细信息，请参阅本页的其余部分。

请注意，从 v1.8 系列开始，mpirun 会自动绑定进程。在没有任何其他指令的情况下，使用三种绑定模式：

绑定到核心：当进程数<= 2时

绑定到套接字：当进程数> 2时

无约束：超额认购时

如果您的应用程序使用线程，那么您可能希望确保根本不受绑定（通过指定 --bind-to none），或者使用适当的绑定级别或每个应用程序进程特定数量的处理元素绑定到多个核心。

在您的例子中，n=22，没有应用绑定，线程可以重新定位。您可以尝试外部 CPU 绑定（例如使用任务集）。您必须进行实验。

Answer 1