high-performance

如何在多个 Nvidia GPU 上本地运行 HPL?
high-performance

如何在多个 Nvidia GPU 上本地运行 HPL?

我正在尝试在我的集群上运行 HPL 基准测试。我想在本地运行它,我使用的文件是hpl-2.0-FERMIV15.但是,我不知道如何在本地使用多个 GPU 运行它。我不知道如何检查我的 HPL 是否在 GPU 上运行以及是否在多个 GPU 上运行。 我还查看了 Nvidia 官方网站,似乎他们只提供了 docker 镜像,并且没有任何关于如何在多个 Nvidia GPU 上本地运行 HPL 的说明。 我很想知道以前是否有人做过类似的事情,因为在互联网上也很难找到相关资源。 ...

Admin

是否可以在集群上安装 Virtual Box 或其他免费虚拟机?
high-performance

是否可以在集群上安装 Virtual Box 或其他免费虚拟机?

我们有一个 CentOS HPC 集群,尽管管理员提出要求,但他们不喜欢给我们 root 访问权限。我在 Ubuntu 的 apt 和 conda-forge 等中找到我需要的软件包有更多的经验。我想知道是否可以要求他们为我们安装虚拟机,而不用担心我们破坏操作系统。有谁知道这是否可能,如果可以,是否可以在 CentOS 上安装的 Ubuntu 虚拟机中使用多个集群?我认为并行模拟的性能损失是合理的,但即使损失适度,我也可以忍受。 ...

Admin

为什么RAMFS比Ram慢很多?
high-performance

为什么RAMFS比Ram慢很多?

我的 PC 上安装了 64GB DDR4 3200MHz 内存。当我运行时sysbench,我得到以下结果: # sysbench memory --memory-block-size=1M --memory-total-size=10G run sysbench 1.0.20 (using system LuaJIT 2.1.0-beta3) Running the test with following options: Number of threads: 1 Initializing random number generator from cur...

Admin

slub_min_objects :为什么 0 可以作为有效/默认值/基本原理?
high-performance

slub_min_objects :为什么 0 可以作为有效/默认值/基本原理?

mm/slub.c在我的linux_5.4内核的源代码()的注释中,我可以读到: In order to reach satisfactory performance we must ensure that a minimum number of objects is in one slab. Otherwise we may generate too much activity on the partial lists which requires taking the list_lock. This is less a concern for large...

Admin

是否可以跟踪 GPU 性能提升?
high-performance

是否可以跟踪 GPU 性能提升?

CentOS7 我正准备升级我的gpu。在采取行动之前,我很好奇是否可以在 cli 上运行任何测试来跟踪当前 GPU 的性能,以便与新 GPU 进行比较? 例如,随着硬盘驱动器性能的提高,我很hdparm好奇是否有类似的显卡和我的新 GPU 将进行大规模升级,如果可能的话,我想记录性能差异。 ...

Admin

如何调整Linux调度程序以实现并行计算?
high-performance

如何调整Linux调度程序以实现并行计算?

我有一台专门用于运行一些并行计算的linux机器,我试图了解如何选择/调整调度程序,也许还有其他参数,以提取最大的性能(这是使用AWS部署的,所以还有一些选择使用什么 Linux 发行版,如果这很重要的话)。 我用 java 实现了计算,因为计算的不同部分之间存在一些微妙的依赖关系(总共大约有 5K 个“任务”,但一个任务通常需要在其执行过程中的多个点获取来自其他任务的信息)。我想考虑两种实现方式。 目前的实施 在当前的实现中,线程的数量等于核心的数量,每个线程都会选择一个不等待任何信息的任务,对其进行处理,直到它因某些丢失的信息而停止,此时它会丢弃该任务任...

Admin

将CPU设置为高性能
high-performance

将CPU设置为高性能

我花了几个小时在互联网上寻找答案。我能找到的一切都没有帮助。我有 Intel i9-9980HK,在 Ubuntu 20.04、内核 5.4.0-33 下运行。 问题是,在满负载情况下,CPU 将频率降低到 2.7 GHZ,我猜是为了保持低功耗预算。无论我尝试什么,我都无法让它运行得更快。它保持在 65 摄氏度以下,静静地、缓慢地处理着数字。为了进行比较,Windows 下的同一台机器在满负载下运行频率为 3 到 4+ GHz。 我尝试过的: 将州长改为performance.没有效果。 设置。/sys/devices/system/cpu/cpufreq...

Admin

如何从 X11/Wayland 会话顶部的内核在屏幕上显示图形?
high-performance

如何从 X11/Wayland 会话顶部的内核在屏幕上显示图形?

我想以尽可能低的延迟(大约几十毫秒)在屏幕上绘制简单(2D 位图)图形(响应(简单)外部输入),这样我就可以凭经验测试绘制到屏幕的结果a)实时,b)尽可能减少开销,c)完全禁用页面翻转(撕裂很好)。 然后我可以将其与在各种刻板(并且可以说是病态的:))场景(例如 X11、Wayland、Wayland+XWayland、Wayland+XWayland+xcompmgr 等)中绘制到屏幕进行比较。 为此,我该如何修改Linux以便我可以绘制超过我现有的 X11/Wayland 会话?换句话说,是的,我想摆弄 DRM(直接渲染管理器), A。从内核内部, 湾。...

Admin

实时改变 bjob​​s 输出
high-performance

实时改变 bjob​​s 输出

当使用 LSF 命令时bjobs,如果我提交另一个作业,我希望立即更改输出,因为一次又一次运行相同的命令让我感到压力。我想要top刷新进程列表的输出之类的东西。 如果top不需要,它会一次又一次地自动刷新。 我想自动刷新bjobs命令的输出。 ...

Admin

LSF队列是否允许抢占自身?
high-performance

LSF队列是否允许抢占自身?

我有一个 LSF 队列,假设它是队列 A。我只希望队列 A 中的较高优先级作业抢占队列 A 中的较低优先级作业,而不是任何其他队列中的作业。如果我将队列A设置为可抢占,是否可以将其设置为仅由其本身(队列A)可抢占?或者如果这是不允许的,那么什么可以实现我的目标? ...

Admin

Linux(内核3.x和4.x)Pthread和通用进程调度算法
high-performance

Linux(内核3.x和4.x)Pthread和通用进程调度算法

我想知道 Linux 内核调度逻辑中是否使用了两个调度(争用)范围(SYSTEM 和 PROCESS)。 POSIX 支持用户级和系统可见可调度单元的 PROCESS 范围 pthread(MXN 模型)和 SYSTEM 范围 pthread(1X1 模型)。 Ulrich Drepper 和 Ingo Molnar (Red Hat) 撰写的文章“The Native POSIX Thread Library for Linux”表明 PROCESS 争用范围过于杀伤力,因此不鼓励使用。 内核 3.x 和 4.x 是否也支持 PROCESS 范围 Pth...

Admin

Linux:如何知道哪些进程固定到哪个核心?
high-performance

Linux:如何知道哪些进程固定到哪个核心?

有没有办法知道哪些核心当前有固定的进程? 即使是其他用户运行的进程也应该在输出中列出。 或者,是否可以尝试将进程固定到核心,但如果所需的核心已经固定了一个进程,则会失败? PS:感兴趣的进程必须将 bin 固定到给定的核心,而不仅仅是当前在给定的核心上运行 PS:这不是重复的,另一个问题是如何确保一个进程独占一个CPU。在这里,我们询问如何检测进程是否固定到给定的核心(即使用了 cpuset,而不是如何使用它)。 ...

Admin

Lustre和HPC配置
high-performance

Lustre和HPC配置

我有一个包含 22 个节点的 HPC 集群,其中一个头节点作为主节点运行Rocks集群操作系统(基于 CentOS)。 节点和主节点通过专用网络 ( 10.10.0.0/16) 进行通信。我们ssh使用路由公共网络 ( 192.168.xxx.xxx/24) 来连接服务器,并且该网络未路由到工作节点。 现在我们的数据已经达到了极限,我们无法再向master添加磁盘了。 现在我们想要建立一个光泽簇由 2 个 OSS 和 1 个 MDS 组成。我的问题是... 我们是否必须将 Lustre OSS 和 MDS 连接到与 HPC 节点 ( 10.10.0....

Admin

高性能计算集群设置
high-performance

高性能计算集群设置

在我的实验室中,我们有几台用于模拟程序的服务器,但它们独立工作。现在我想使用 MPICH 将它们组合成一个集群,使它们进行通信。但存在一个问题,即这些服务器具有不同的操作系统。其中一些是Redhat,一些是Ubuntu。而在MPICH的主页上,我看到这两个不同操作系统的下载站点是不同的,那么是否可以建立一个不同操作系统的集群呢?以及如何做呢? 我不想重新安装这些服务器的原因是,当我提出这个问题时,它们上的数据太多,而且它们没有得到充分利用。 ...

Admin