parallel-computing

探索高级 CPU 虚拟化：合并内核以增强性能

虚拟化专家！我有一个问题，与下面所示的潜在 CPU 虚拟化概念有关。这个想法是否有现有的实现，或者是否存在硬件限制？具体来说，我很好奇你们中是否有人遇到过 CPU 虚拟化，其中服务器 1 上的软件可以合并来自节点（节点 1 和 2）或从属机器的 CPU 内核，以创建具有明显更高内核数的 vCPU。目标是让在服务器 1 上运行的程序感知到更多的 CPU 内核（例如 16 个），而不是实际的 4 个或 8 个。虽然我知道大数据可能采用类似的方法，但它通常涉及将程序分解为 map-reduce 机制。我的疑问是虚拟...

Admin 2024-6-2

parallel-computing

循环遍历 $allArrays 中的所有 arrayList。$allArrays 中的每个 arrayList 包含 10K 个用户 ID。

使用 PS 7.3.4 代码运行良好，没有错误。问题- 脚本消耗的 RAM 不断增长。如何释放 RAM？如何查看哪些内容消耗了 RAM？任何建议都将不胜感激。处理 10K 输入批次后的内存结果第一组 10K 内存结果结束。收集之前使用的循环内存：1,208,928,432 完整收集后循环使用的内存：512,021,912 第二组10K内存结果结束。收集前循环使用的内存：1,160,822,952 完整收集后循环使用的内存：929,192,840 第三组10K内存结果结束。收集前循环使用的内存：2,168,048,568 完整收集后循环使用的内存：...

Admin 2024-6-2

parallel-computing

在 1 台物理服务器上设置 2 个不同节点和 2 个不同分区的 slurm

我需要在一台物理服务器上设置 slurm，有 2 个不同的分区和 2 个主节点，因此需要， partation1 需要有 node1 并且需要由 group1 用户使用 partation2 需要有 node2 并且需要由 group2 用户使用在 1 台物理服务器上，如果有人可以提供帮助，这可能吗？如果可以，怎么做？ ...

Admin 2024-6-2

parallel-computing

ZFS Scrub 是否支持并行化以提高性能，例如使用 64 核 AMD Threadripper Pro？

我有一个 24 驱动器 zpool，由 3 个 RAIDZ1 vdev 组成，每个 vdev 运行 8 个 Seagate Exos X18 16TB 驱动器。它位于 Supermicro MB 上，配备 64 核（128 线程）AMD Threadripper Pro 和 256GB ECC RAM。清理期间的系统利用率显示每次最多使用 2 个 CPU，并且总清理时间看起来可能需要五到七天。有没有办法让所有 CPU 核心并行执行清理工作以加快速度？ ...

Admin 2024-6-2

parallel-computing

并行 R 进程中的最佳 Swappiness

我理解最佳 swappiness 取决于应用程序。数据库服务器的 swappiness 通常接近于零，而在许多其他情况下，似乎建议保留默认值 60。但是，我不确定哪种设置适合我的场景。该服务器运行 Ubuntu 20.04，有 8 个 CPU、大约 30 GB 的 RAM 和一个 SSD 驱动器。我使用它来执行通常涉及地理空间数据的并行（SOCK 集群）R 脚本。在运行 R 脚本时，我不会在机器上执行任何其他应用程序。而且我直接从磁盘上的文件读取数据，而不是从任何 SQL 或其他数据库系统读取数据。在当前任务中，该进程每隔几分钟就会超过可用 RAM 几秒钟...

Admin 2024-6-1

parallel-computing

IBM GPFS：递归删除文件非常慢

为了在我们的 IBM GPFS 集群中递归删除文件，我们使用简单的 unix 命令，例如： rm /my/directories -fr 然而删除操作需要花费很长时间。问题是我们的分布式应用程序（基于 Spark）需要花费一些时间one hour才能完成。但随后，它还会took about an other hour删除由 Spark 等分布式应用程序生成的临时文件。因此，全局工作负载效率很低。可能是因为该rm命令必须列出每个子目录。无论如何，您知道如何使用 GPFS 有效地删除整个目录（和子目录）吗？ IBM 是否可以给出特殊命令来执行此操作？ ...

Admin 2024-6-1

parallel-computing

我如何知道我的服务器可以运行的最大线程数？

以下是机器规格： CPU(s): 20 Thread(s) per core: 1 Core(s) per socket: 10 Socket(s): 2 根据我目前所读到的内容，这些数字意味着我可以运行 20 个并行作业，因为我有 20 个 CPU。但是，每个 CPU 上可以运行多少个线程？ ...

Admin 2024-6-1

parallel-computing

如何使用混合 MPI/Openmp 启动 PBS 作业

我想了解使用混合并行化 MPI/OpenMPI 的 PBS/Torque 在我的 SGI 集群上启动的 GROMACS 作业的工作原理。该集群启用了超线程，每个节点有 16 个物理核心（32 个逻辑核心）。我期望：使用 4 个节点和每个节点的所有可用 CPU（因此每个节点有 16 个物理 CPU 和 32 个线程，如果我没记错的话，总共有 64 个核心和 128 个线程）。我做了一个测试工作，应该能满足我的期望。这些是我在 PBS 脚本中用于询问资源的行： ... #PBS -l select=4:ncpus=16:mpiprocs=16...

Admin 2024-6-1

parallel-computing

仅按顺序运行的 R 脚本，有没有办法将其执行并行到多核？

我有一些 R 脚本，它们只能按顺序运行，不能分成块，或者无法使用 R 或任何其他语言的任何并行库。有什么方法可以将代码的顺序执行分发到多个核心或者网络中的多个服务器上？以加快执行速度？ ...

Admin 2024-5-31

parallel-computing

与 clamscan 并行扫描整个文件系统

我每周都会在我的服务器上运行一次 clamav 扫描。有一台服务器拥有 30TB 磁盘空间的 raid6 集群，扫描需要 24 小时以上才能完成。所以我想知道如何才能在整个文件系统上运行 clamscan，充分利用服务器的多个核心？服务器具有良好的输入/输出能力，我希望扫描能够以硬件所能达到的速度进行。我知道--multiscan的参数clamdscan。我对 clamdscan 的主要问题是它无法处理用户clamav无法访问的文件，并且似乎不鼓励以 root 身份运行守护进程。我看到有些人正在使用平行线来实现这一点，但我找不到真正扫描整个文件系...

Admin 2024-5-31

parallel-computing

在 AWS 实例上使用不同的参数执行脚本

我有一个接受多个参数的脚本，我需要在 AWS 上的多个实例上并行运行此脚本。例如，为了简单起见，如果我在 AWS 中有三个实例，我想运行以下命令： On instance-a: script.sh a b On instance-b: script.sh s t On instance-c: script.sh y z 我将使用 AMI 生成实例，AMI 将运行时（MATLAB）和程序（使用运行时）作为映像的一部分安装。我正在检查这链接，我看到 Capistrano 被提及。这在我的例子中有用吗？还有其他可以探索的轻量级替代方案吗？顺便说一下，我需...

Admin 2024-5-31

parallel-computing

Centos7 Supermicro 服务器上的多核过载超过 100%

我在超微 H8QG6 主板上运行 Centos 7 (3.10.0-514.26.2.el7.x86_64)，该主板有 4 个 AMD 6276 CPU（16 核），总共 64 个核。我用它来进行科学计算，通常一切都运行顺利，就像 htop 中一样第一张图片然后，突然间，htop 开始报告单个 CPU 使用率超过 1000%，如下所示第二张图片，计算机几乎无响应。顺便说一句，几乎每个进程似乎都使 CPU 超载：甚至 htop 本身也报告了 1600% 的负载！！！同时这些错误出现在 journalctl 中： perf: interrupt took to...

Admin 2024-5-31

parallel-computing

执行命令，完成后并行化其他命令

我正在寻找一个要执行的单内联命令/bin/first，然后当它完成之后并行执行以下/bin/p1命令。/bin/p2/bin/p3 ...

Admin 2024-5-31

parallel-computing

无论启动多少个线程，应用程序每个核心的利用率上限为 20%

我正在尝试使用二手的 Dell Poweredge R900 作为计算池（4 个四核处理器为我提供了 16 个核心来运行模拟）。它目前运行的是 Windows Server 2008 R2 Enterprise。我正在运行自定义 .net 代码，并且可以将线程数指定为我想要的任何数量。通常（例如在我的 Windows 10 四核机器上），一个线程会占用一个 CPU 核心 10 分钟左右。但是，如果我在服务器上启动 7 个线程（作为示例），我会看到 16 个核心中的 7 个以 20% 的利用率亮起。如果我启动 16 个线程，我会看到所有 16 个核心的...

Admin 2024-5-31

parallel-computing

GNU parallel 无法充分利用我的 CPU

我在我的 36 核服务器（EC2 c4.8xlarge/Amazon Linux）上运行这样的命令。 find . -type f | parallel -j 36 mycommand 需要处理的文件数量约为 1,000,000 个，需要数十分钟。它应该同时运行 36 个进程。但是从的结果来看top，最多只有 10 个进程，其中 70% 处于空闲状态。ps显示更多进程，但其中大多数已停止运行。我猜是因为每个进程mycommand完成得太快，parallel赶不上新进程的产生。所以我尝试 parallel --nice 20给自己分配更多的 CPU...

Admin 2024-5-30