在 HPC 集群中运行作业

在 HPC 集群中运行作业

我对 HPC 环境还很陌生。在利用 8 个核心的节点上运行作业和在利用 1 个核心的 8 个节点上运行相同作业在性能或所用挂机时间方面有什么区别吗?

PS:我正在做一个项目,需要在集群中运行一个脚本,大约需要 2-3 天才能输出结果。因此有这样的疑问,以避免不相关的测试。

答案1

可能吧。不过很难说哪个会更快,因为有很多因素。如果可能的话,运行一个较小版本的程序,以便可以比较两者。以下是一些影响性能的因素:

  • 进程间通信(正如 Michael 在他的评论中提到的):同一节点上的核心之间的通信比 Infiniband 更快。
  • 资源竞争:在同一节点上运行的进程/线程必须共享 I/O(磁盘和网络)和内存等资源。

如果这是一个 CPU 绑定型应用程序并且您有 8 个可用节点,那么您可以考虑使用全部 64 个核心。

相关内容