parallel-computing

探索高级 CPU 虚拟化:合并内核以增强性能
parallel-computing

探索高级 CPU 虚拟化:合并内核以增强性能

虚拟化专家!我有一个问题,与下面所示的潜在 CPU 虚拟化概念有关。这个想法是否有现有的实现,或者是否存在硬件限制?具体来说,我很好奇你们中是否有人遇到过 CPU 虚拟化,其中服务器 1 上的软件可以合并来自节点(节点 1 和 2)或从属机器的 CPU 内核,以创建具有明显更高内核数的 vCPU。目标是让在服务器 1 上运行的程序感知到更多的 CPU 内核(例如 16 个),而不是实际的 4 个或 8 个。 虽然我知道大数据可能采用类似的方法,但它通常涉及将程序分解为 map-reduce 机制。我的疑问是虚拟...

Admin

循环遍历 $allArrays 中的所有 arrayList。$allArrays 中的每个 arrayList 包含 10K 个用户 ID。
parallel-computing

循环遍历 $allArrays 中的所有 arrayList。$allArrays 中的每个 arrayList 包含 10K 个用户 ID。

使用 PS 7.3.4 代码运行良好,没有错误。 问题- 脚本消耗的 RAM 不断增长。如何释放 RAM?如何查看哪些内容消耗了 RAM?任何建议都将不胜感激。 处理 10K 输入批次后的内存结果 第一组 10K 内存结果结束。 收集之前使用的循环内存:1,208,928,432 完整收集后循环使用的内存:512,021,912 第二组10K内存结果结束。 收集前循环使用的内存:1,160,822,952 完整收集后循环使用的内存:929,192,840 第三组10K内存结果结束。 收集前循环使用的内存:2,168,048,568 完整收集后循环使用的内存:...

Admin

在 1 台物理服务器上设置 2 个不同节点和 2 个不同分区的 slurm
parallel-computing

在 1 台物理服务器上设置 2 个不同节点和 2 个不同分区的 slurm

我需要在一台物理服务器上设置 slurm,有 2 个不同的分区和 2 个主节点,因此需要, partation1 需要有 node1 并且需要由 group1 用户使用 partation2 需要有 node2 并且需要由 group2 用户使用 在 1 台物理服务器上,如果有人可以提供帮助,这可能吗?如果可以,怎么做? ...

Admin

ZFS Scrub 是否支持并行化以提高性能,例如使用 64 核 AMD Threadripper Pro?
parallel-computing

ZFS Scrub 是否支持并行化以提高性能,例如使用 64 核 AMD Threadripper Pro?

我有一个 24 驱动器 zpool,由 3 个 RAIDZ1 vdev 组成,每个 vdev 运行 8 个 Seagate Exos X18 16TB 驱动器。它位于 Supermicro MB 上,配备 64 核(128 线程)AMD Threadripper Pro 和 256GB ECC RAM。 清理期间的系统利用率显示每次最多使用 2 个 CPU,并且总清理时间看起来可能需要五到七天。 有没有办法让所有 CPU 核心并行执行清理工作以加快速度? ...

Admin

并行 R 进程中的最佳 Swappiness
parallel-computing

并行 R 进程中的最佳 Swappiness

我理解最佳 swappiness 取决于应用程序。数据库服务器的 swappiness 通常接近于零,而在许多其他情况下,似乎建议保留默认值 60。但是,我不确定哪种设置适合我的场景。 该服务器运行 Ubuntu 20.04,有 8 个 CPU、大约 30 GB 的 RAM 和一个 SSD 驱动器。我使用它来执行通常涉及地理空间数据的并行(SOCK 集群)R 脚本。在运行 R 脚本时,我不会在机器上执行任何其他应用程序。而且我直接从磁盘上的文件读取数据,而不是从任何 SQL 或其他数据库系统读取数据。在当前任务中,该进程每隔几分钟就会超过可用 RAM 几秒钟...

Admin

IBM GPFS:递归删除文件非常慢
parallel-computing

IBM GPFS:递归删除文件非常慢

为了在我们的 IBM GPFS 集群中递归删除文件,我们使用简单的 unix 命令,例如: rm /my/directories -fr 然而删除操作需要花费很长时间。 问题是我们的分布式应用程序(基于 Spark)需要花费一些时间one hour才能完成。但随后,它还会took about an other hour删除由 Spark 等分布式应用程序生成的临时文件。 因此,全局工作负载效率很低。可能是因为该rm命令必须列出每个子目录。 无论如何,您知道如何使用 GPFS 有效地删除整个目录(和子目录)吗? IBM 是否可以给出特殊命令来执行此操作? ...

Admin

我如何知道我的服务器可以运行的最大线程数?
parallel-computing

我如何知道我的服务器可以运行的最大线程数?

以下是机器规格: CPU(s): 20 Thread(s) per core: 1 Core(s) per socket: 10 Socket(s): 2 根据我目前所读到的内容,这些数字意味着我可以运行 20 个并行作业,因为我有 20 个 CPU。 但是,每个 CPU 上可以运行多少个线程? ...

Admin

如何使用混合 MPI/Openmp 启动 PBS 作业
parallel-computing

如何使用混合 MPI/Openmp 启动 PBS 作业

我想了解使用混合并行化 MPI/OpenMPI 的 PBS/Torque 在我的 SGI 集群上启动的 GROMACS 作业的工作原理。 该集群启用了超线程,每个节点有 16 个物理核心(32 个逻辑核心)。 我期望:使用 4 个节点和每个节点的所有可用 CPU(因此每个节点有 16 个物理 CPU 和 32 个线程,如果我没记错的话,总共有 64 个核心和 128 个线程)。 我做了一个测试工作,应该能满足我的期望。这些是我在 PBS 脚本中用于询问资源的行: ... #PBS -l select=4:ncpus=16:mpiprocs=16...

Admin

与 clamscan 并行扫描整个文件系统
parallel-computing

与 clamscan 并行扫描整个文件系统

我每周都会在我的服务器上运行一次 clamav 扫描。有一台服务器拥有 30TB 磁盘空间的 raid6 集群,扫描需要 24 小时以上才能完成。 所以我想知道如何才能在整个文件系统上运行 clamscan,充分利用服务器的多个核心?服务器具有良好的输入/输出能力,我希望扫描能够以硬件所能达到的速度进行。 我知道--multiscan的参数clamdscan。我对 clamdscan 的主要问题是它无法处理用户clamav无法访问的文件,并且似乎不鼓励以 root 身份运行守护进程。 我看到有些人正在使用平行线来实现这一点,但我找不到真正扫描整个文件系...

Admin

在 AWS 实例上使用不同的参数执行脚本
parallel-computing

在 AWS 实例上使用不同的参数执行脚本

我有一个接受多个参数的脚本,我需要在 AWS 上的多个实例上并行运行此脚本。例如,为了简单起见,如果我在 AWS 中有三个实例,我想运行以下命令: On instance-a: script.sh a b On instance-b: script.sh s t On instance-c: script.sh y z 我将使用 AMI 生成实例,AMI 将运行时(MATLAB)和程序(使用运行时)作为映像的一部分安装。 我正在检查这链接,我看到 Capistrano 被提及。这在我的例子中有用吗?还有其他可以探索的轻量级替代方案吗?顺便说一下,我需...

Admin

Centos7 Supermicro 服务器上的多核过载超过 100%
parallel-computing

Centos7 Supermicro 服务器上的多核过载超过 100%

我在超微 H8QG6 主板上运行 Centos 7 (3.10.0-514.26.2.el7.x86_64),该主板有 4 个 AMD 6276 CPU(16 核),总共 64 个核。我用它来进行科学计算,通常一切都运行顺利,就像 htop 中一样第一张图片然后,突然间,htop 开始报告单个 CPU 使用率超过 1000%,如下所示第二张图片,计算机几乎无响应。顺便说一句,几乎每个进程似乎都使 CPU 超载:甚至 htop 本身也报告了 1600% 的负载!!!同时这些错误出现在 journalctl 中: perf: interrupt took to...

Admin

无论启动多少个线程,应用程序每个核心的利用率上限为 20%
parallel-computing

无论启动多少个线程,应用程序每个核心的利用率上限为 20%

我正在尝试使用二手的 Dell Poweredge R900 作为计算池(4 个四核处理器为我提供了 16 个核心来运行模拟)。它目前运行的是 Windows Server 2008 R2 Enterprise。 我正在运行自定义 .net 代码,并且可以将线程数指定为我想要的任何数量。通常(例如在我的 Windows 10 四核机器上),一个线程会占用一个 CPU 核心 10 分钟左右。但是,如果我在服务器上启动 7 个线程(作为示例),我会看到 16 个核心中的 7 个以 20% 的利用率亮起。如果我启动 16 个线程,我会看到所有 16 个核心的...

Admin

GNU parallel 无法充分利用我的 CPU
parallel-computing

GNU parallel 无法充分利用我的 CPU

我在我的 36 核服务器(EC2 c4.8xlarge/Amazon Linux)上运行这样的命令。 find . -type f | parallel -j 36 mycommand 需要处理的文件数量约为 1,000,000 个,需要数十分钟。它应该同时运行 36 个进程。但是从 的结果来看top,最多只有 10 个进程,其中 70% 处于空闲状态。ps显示更多进程,但其中大多数已停止运行。 我猜是因为每个进程mycommand完成得太快,parallel赶不上新进程的产生。所以我尝试 parallel --nice 20给自己分配更多的 CPU...

Admin