运行多个作业时 HPC 集群 (sge) 性能低下

Question 1

在不知道集群设置的情况下，我想知道 CPU 是否使用了超威胁？超威胁核心显示为物理核心数量的两倍，但非物理核心的计算能力可能不会线性增加。

Answer

在不知道集群设置的情况下，我想知道 CPU 是否使用了超威胁？超威胁核心显示为物理核心数量的两倍，但非物理核心的计算能力可能不会线性增加。

Question 2

可能有几个原因。

尽管您的作业不会占用大量内存，但它们可能会填满内存总线（将 CPU 连接到 RAM）。如果总线已满，添加更多作业只会给内存总线带来更多压力，导致一切变慢。

另一个可能的原因是 I/O。如果您的作业执行大量文件操作（例如打开/写入/关闭文件操作），如果同时运行太多作业，系统中的磁盘可能无法跟上。

其他原因是 CPU 中的其他瓶颈，例如共享缓存或浮点执行单元。

Answer

可能有几个原因。

尽管您的作业不会占用大量内存，但它们可能会填满内存总线（将 CPU 连接到 RAM）。如果总线已满，添加更多作业只会给内存总线带来更多压力，导致一切变慢。

另一个可能的原因是 I/O。如果您的作业执行大量文件操作（例如打开/写入/关闭文件操作），如果同时运行太多作业，系统中的磁盘可能无法跟上。

其他原因是 CPU 中的其他瓶颈，例如共享缓存或浮点执行单元。

相关内容