bash 脚本中的并行性

bash 脚本中的并行性

让我们考虑 n 个语句 s1, s2, s3,..., sn。每个语句都有无限的执行步骤,我想并行运行所有语句。

我的 shell 脚本看起来像

s1 
s2 
s3
.
.
.
sn

如何更改我的代码以便发生交错?

答案1

听起来要求每个语句在后台运行可以实现您想要的:

s1 &
s2 &
...
sn &
wait

(该wait命令使脚本在前台运行,直到所有后台任务完成。)

如果您需要更多控制,请考虑使用 GNU 并行。

答案2

GNU Parallel 就是为此而生的:

cat file_with_commands | parallel

默认情况下,每个 CPU 核心执行一项作业。如果您想要的不仅仅是核心:

parallel -j200 < file_with_commands

如果您的命令非常相似:

parallel s{} ::: {1..100}

将并行运行s1s2...。s100

GNU Parallel 是一个通用并行器,可以轻松地在同一台计算机或多台您可以通过 ssh 访问的计算机上并行运行作业。

如果您想要在 4 个 CPU 上运行 32 个不同的作业,则并行化的直接方法是在每个 CPU 上运行 8 个作业:

简单的调度

相反,GNU Parallel 在完成后会生成一个新进程 - 保持 CPU 处于活动状态,从而节省时间:

GNU 并行调度

安装

出于安全原因,您应该使用软件包管理器安装 GNU Parallel,但如果 GNU Parallel 未针对您的发行版打包,您可以进行个人安装,这不需要 root 访问权限。这样做可以在 10 秒内完成:

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

对于其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README

了解更多

查看更多示例:http://www.gnu.org/software/parallel/man.html

观看介绍视频:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

浏览本教程:http://www.gnu.org/software/parallel/parallel_tutorial.html

注册电子邮件列表以获得支持:https://lists.gnu.org/mailman/listinfo/parallel

相关内容