parallel-processing

并行化 rsync
parallel-processing

并行化 rsync

我刚刚搬家,经过反复试验后发现,在我家和远程服务器之间的某个地方,存在一些限制……但限制不是很智能。它只会限制单个连接。因此,如果我复制一个 1 GB 的文件,它将以 150 kBps 的速度顺利进行。但如果我初始化 10 个副本,每个副本的速度都会达到 150 kBps(即,我通过多个连接获得了更高的总带宽)。 我经常使用 rsync 将一些大型数据集从工作地点同步到家中(幸运的是,这些数据集以许多文件的形式存在)。有没有办法告诉 rsync 使用多个连接进行下载?理论上应该可以,因为据我所知,rsync 首先会确定必要的更改,然后执行实际传输。如果有一...

Admin

允许运行一段时间后终止进程
parallel-processing

允许运行一段时间后终止进程

我想限制grep进程命令允许运行或存活的时间。 例如。我想执行以下操作: grep -qsRw -m1 "parameter" /var 但是在运行grep命令之前,我想限制该grep进程的存活时间,比如说不超过 30 秒。 我该怎么做呢? 如果可以,我该如何返回或重置才能不受时间限制。 ...

Admin

Bash:并行执行一些进程但等待最慢的进程
parallel-processing

Bash:并行执行一些进程但等待最慢的进程

您好,我正在编写一个 bash 脚本,其中我必须使用 ipset-restore 命令恢复大约 8 个以上的大 ip 集。 实际上我的 shell 脚本基本上有一个类似的列表 ipset-restore < 列表 1.txt ipset-restore < 列表 2.txt ipset-restore < 列表 3.txt ... 以这种方式执行操作非常慢,并且因为机器有资源并且 ipset 是多线程的,可以并行执行各种操作,所以我想一次执行许多 ipset-restore。 我想到使用禁止但是这样做会让我无法在执行新指令之前查看进程是否已...

Admin

“多处理器”和“并行处理器”之间有什么区别?
parallel-processing

“多处理器”和“并行处理器”之间有什么区别?

我想知道“多处理器”和“并行处理器”之间通常有什么区别? 我在 Stallings 的《计算机组织和体系结构》中看到了它们(见下面的截图)。书中写道: 计算机组织可以通过存在一个或多个控制单元来区分。多个控制单元意味着多个处理器。根据我们之前的讨论,如果多个处理器可以协同完成给定任务,则它们被称为并行处理器。 如果多处理器与并行处理器形成对比,那么多处理器是否是多个不合作执行任务的处理器? 我还有另一个猜测,基于一种印象,可能是在某处看到过类似的东西。多处理器中的处理器是否共享相同的主内存?如果并行处理器与多处理器相反,那么并行处理器是否不共享相同的主内...

Admin

如何在多台计算机上同时运行 powershell 脚本
parallel-processing

如何在多台计算机上同时运行 powershell 脚本

我正在尝试同时在多台计算机上运行我拥有的 PowerShell 脚本。目前,我使用的是 PowerShell 版本 5。 我想知道是否可以在没有后台进程的情况下运行它,以便更好地理解日志。 $computers = @("Hostname1", "Hostname2", "Hostname3") $scriptPath = "C:\Projects\Scripts\Environment\InstallEnvironment.ps1" $scriptBlock = { param ( [string]$scriptPath ...

Admin

为什么存在 SIMD CPU 扩展?
parallel-processing

为什么存在 SIMD CPU 扩展?

据我了解,有些问题可以高度并行化,例如渲染、视频解码。由于 CPU 在此类任务上表现不佳,因此创建了 GPU。它们使用不同的架构来执行 SIMD 执行。它们还具有一种特殊类型的内存,非常适合独立访问 GPU“线程”。 然而,我们看到 x86 架构获得了许多专注于流处理的扩展,例如 SSE 或 AVX。它们也是 SIMD,并且出于某种原因在 CPU 端运行。那么添加它们有什么意义呢? 这些扩展与常规 GPU 相比有什么优势?我的意思是 GPU 具有更高的内存带宽和其他功能,但这不会使带有扩展的 CPU 处于劣势吗?它们不会遇到内存带宽问题吗? 我知道并非每...

Admin

为什么 Python 脚本只使用了 12 个核心中的 6 个?
parallel-processing

为什么 Python 脚本只使用了 12 个核心中的 6 个?

我跑耳语在配备 Intel Core i7-CPU 的 Intel-Mac 上(Whisper 目前似乎不支持 AMD Radeon GPU,因此我使用 CPU)。当我在这台电脑上运行 Whisper 时,当它大部分时间处于空闲状态时,Whisper 占用了大约 500-550% 的 CPU(1200% 是最大值 - 6+6 个内核),因此大约使用了我 CPU 容量的一半。如果我启动另一个 Whisper,它也会占用 500-550%,这意味着我的 CPU 或多或少被充分利用了。 换句话说,处理两个文件的速度大约是一半。我更愿意全速处理一个文件,也就是说,第...

Admin

Powershell:脚本不会并行运行
parallel-processing

Powershell:脚本不会并行运行

我有以下脚本。当它不并行时,它将毫无问题地运行。但是当我添加-Parallel它时,它会抛出各种错误。主要错误似乎与有关Cannot index into a null array。我使用的是 PS 7.3.3。有什么建议吗? 脚本的非并行部分(脚本的开始) $fileList=(get-childitem -filter *.tif -recurse | Where-Object {$_.name -match '^[0-9]{3} (B|F) [A-Z]{2} ..K..b [0-9]{2}.*'}).Na...

Admin

按顺序获取并行 ssh 输出但使用并行性
parallel-processing

按顺序获取并行 ssh 输出但使用并行性

使用parellel-ssh -i -h hosts.ini "uptime"我可以从 中获取所有主机的正常运行时间hosts.ini。但它们按批次和第一个答案的顺序显示。我希望结果按 hosts.ini 中的顺序排列。 我可以使用-p 1这个来获得它,但这样就不再有并行性,而且进程非常慢。有没有办法使用 paraellel-ssh 选项来同时获得两者?当然,我可以按字母顺序或其他顺序排列我的 hosts.ini 和结果。但就我而言,hosts.ini 中的顺序取决于另一个来源。 ...

Admin

并行处理实现
parallel-processing

并行处理实现

我公司收到一个需要重构的非常老旧的程序。代码是一堆 SQL 指令,由一个以 shell 命令形式编写的程序编排,目的是处理大型空间数据集。 在 shell 命令中间,有这个实现(如下),理论上并行启动几个 psql 进程。我以前从未见过这种情况。 代码获取这个参数numProc,它是将启动的进程的数量。 文档表明 numProc 是机器中可用的核心数。 这个 for 循环遍历 postgresql 数据库中关系的片段,然后将所有内容插入到新表中。 var_proc 用于切分关系,所以它不是这里的重点。 for ((i=0; i < ${numP...

Admin

通过 Infiniband 互连连接两个桌面
parallel-processing

通过 Infiniband 互连连接两个桌面

我是一名从事高性能计算项目(计算编程方面)的科学家,我不知道回答我的问题所需的网络或网络硬件。我的一位在 HPC 工作的教授朋友给了我以下配置 - 购买两个 AMD Ryzen 16 核处理器并通过无限带宽互连将它们连接起来。我们计划购买 2 台承载这些 AMD Ryzen 16 核处理器的台式机。我们希望这能为我们提供与 32 核处理器相同的速度。如果有人问为什么不买一个 32 核处理器,答案是当前的市场情况已经导致 32 核或 64 核处理器不可用(全球现芯片短缺) 我的问题是,上述架构是否允许将来添加 64 核处理器,或者此集群中的所有节点是否都必须具...

Admin

如何阻止 Ubuntu 20.04 限制我的 CPU 空间?
parallel-processing

如何阻止 Ubuntu 20.04 限制我的 CPU 空间?

安装 Ubuntu 20.04 后,一切都运行良好。但是,在安装和使用一些应用程序(Matlab 和 Matlab/Dynare)后,Ubuntu 似乎限制了我的 CPU 使用率。我使用 openMP 和一个曾经实现 100% CPU 使用率的代码,但现在速度慢了很多,top 显示以下内容: 从顶部输出 我的处理器总共有 32 个内核和 64 个线程。此代码使用了所有线程,之前 CPU 使用率达到 100%。但是,现在总 CPU 使用率仅为 18.9%。还请注意,主作业几乎使用了 6400% 的 CPU=64*100。与以前相比,现在的代码非常慢。以下是 h...

Admin

任何程序都可以在多核上运行吗?CPU 会决定吗?还是只有某些程序可以在多核上运行?
parallel-processing

任何程序都可以在多核上运行吗?CPU 会决定吗?还是只有某些程序可以在多核上运行?

因此,我对多核 CPU 有点困惑 - 我最初的印象和我以前听到的印象是,有些程序无法跨多个核心运行 - 例如,另一个循环的输入取决于先前的输出 另一方面,我看到其他人声称似乎任何程序都可以在多个核心上运行(这是否必须由程序员指定(例如,通过分配线程),或者 CPU 是否能够在核心之间分配密集型程序?) 但与此同时,我也听别人说过,一个进程只能在一个核心上运行 我希望有人能澄清这一点,或者为我应该去哪里寻找提供一些建议。我觉得我读到的内容——如果不是错误的——可能至少已经过时了,或者可能因处理器型号等而异 不过,提前感谢你的帮助 ...

Admin

使用递归循环的并行处理和执行顺序
parallel-processing

使用递归循环的并行处理和执行顺序

如果我运行一个脚本使用并行处理递归地处理路径如果要对整个树执行命令,我保证我使用的命令将在单个目录中的所有项目上执行在进入下一个步骤之前? Get-ChildItem $Path -Recurse -Filter *.some_file_extension | ForEach-Object -Parallel { my_command $_ --with_options } ...

Admin

PowerShell:脚本并行抛出
parallel-processing

PowerShell:脚本并行抛出

在 中运行时-Parallel,以下脚本不会传递$basePath在并行块开始之前声明的变量。相反,它是一个空值。当脚本不在 中运行时,这不是问题-Parallel——它将传递变量值并按预期​​运行。仅供参考,我正在运行 PS 7.x。 $basePath=((get-location) -replace "\\", "\\") get-childitem *.tif -recurse | foreach-object -Parallel { $a=($_ -split "\.tif")[0] $path=(((split-path $_) ...

Admin