如何bash多线程?

如何bash多线程?
#!/bin/bash
while IFS="," read  ip port; do
    ruby test.rb "http://$ip:$port/"&
    ruby test.rb "https://$ip:$port/";
 done <test1.txt

我将如何做这个多线程?如果我做更多行除以&,它只会多次使用相同的IP和端口运行相同的命令,我希望它使用下一个IP和端口运行,也不相同的文件看起来像192.168.1.2,8089,

答案1

我会这样做:

parallel --colsep , ruby test.rb {3}://{1}:{2}/ :::: ipport.txt ::: http https

默认情况下,每个 cpu 核心运行一项作业。这可以-j20针对 20 个并行作业进行调整。

xargs- 解决方案相反,您可以对输出进行后处理:输出是序列化的,因此您永远不会看到两个作业混合的输出。

GNU Parallel 是一个通用并行器,可以轻松地在同一台计算机或多台您可以通过 ssh 访问的计算机上并行运行作业。

如果您想要在 4 个 CPU 上运行 32 个不同的作业,则并行化的直接方法是在每个 CPU 上运行 8 个作业:

简单的调度

相反,GNU Parallel 在完成后会生成一个新进程 - 保持 CPU 处于活动状态,从而节省时间:

GNU 并行调度

安装

出于安全原因,建议您使用包管理器进行安装。但如果您无法做到这一点,那么您可以使用此 10 秒安装。

10秒安装会尝试进行完整安装;如果失败,则进行个人安装;如果失败,则进行最小安装。

$ (wget -O - pi.dk/3 || lynx -source pi.dk/3 || curl pi.dk/3/ || \
   fetch -o - http://pi.dk/3 ) > install.sh
$ sha1sum install.sh | grep 883c667e01eed62f975ad28b6d50e22a
12345678 883c667e 01eed62f 975ad28b 6d50e22a
$ md5sum install.sh | grep cc21b4c943fd03e93ae1ae49e28573c0
cc21b4c9 43fd03e9 3ae1ae49 e28573c0
$ sha512sum install.sh | grep da012ec113b49a54e705f86d51e784ebced224fdf
79945d9d 250b42a4 2067bb00 99da012e c113b49a 54e705f8 6d51e784 ebced224
fdff3f52 ca588d64 e75f6033 61bd543f d631f592 2f87ceb2 ab034149 6df84a35
$ bash install.sh

对于其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README

了解更多

下载备忘单:http://www.gnu.org/s/parallel/parallel_cheat.pdf

查看更多示例:http://www.gnu.org/software/parallel/man.html

观看介绍视频:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

浏览本教程:http://www.gnu.org/software/parallel/parallel_tutorial.html

注册电子邮件列表以获得支持:https://lists.gnu.org/mailman/listinfo/parallel

答案2

tr ',' ':' <test1.txt | xargs -P 4 -I XX ruby test.rb "http://XX/"

假设该test1.txt文件包含类似以下的行

127.0.0.1,80
127.0.0.1,8080

然后tr将其更改为

127.0.0.1:80
127.0.0.1:8080

并且xargs一次会获取一行并XX用该行的内容替换给定的命令字符串并运行命令。我们-P 4最多可以同时运行四个进程。

如果您的文件每行都有尾随逗号,请先删除它们:

sed 's/,$//' test1.txt | tr ',' ':' | xargs ...as above...

甚至

sed -e 's/,$//' -e 'y/,/:/' test1.txt | xargs ...as above...

答案3

gnu-parallelxargs是更好的选择,但为了演示如何使用 while 循环执行此操作,我看到了两个主要选项:

一切同时:

while IFS="," read  ip port; do
    ruby test.rb "http://$ip:$port/" <&- &
done <test1.txt

限制自己一次只能吃 2 个:

while IFS="," read  ip port; do
    ruby test.rb "http://$ip:$port/" <&- &
    IFS=, read ip port || break
    ruby test.rb "http://$ip:$port/" <&- &
    wait
done <test1.txt

第二种不太理想,因为在一个进程完成和第二个进程完成之间会有停滞时间,并且随着您添加更多进程,这个问题会变得更严重。您可以尝试在 shell 中修复该问题,但由于xargsparallel已经存在,因此没有多大意义。

相关内容