将文件和路径名的列表(文本文件)发送到 xargs

将文件和路径名的列表(文本文件)发送到 xargs

我有一个包含各种文件的路径的文件。

文件.txt:

/path/to/file1.txt
/path/to/file2.txt
...
/path/to/fileN.txt

我想在脚本中使用它来处理文件。

cat files.txt | xargs -P 12 -L 1 -I % /software/Linux/itt/idl/idl81/bin/idl -e program -args %

我基本上想通过 xargs 作为参数将这些路径作为字符串发送到这个 IDL 程序。

然而,当我使用cat时,它实际上cats file1.txt、file2.txt,并将它们的内容直接作为参数输出到这个IDL程序中。

我怎样才能让它将这个 files.txt 中的每一行作为字符串发送到这个 IDL 脚本?

答案1

您可以使用带有这样的循环的小脚本

随它去运行IDL.sh

#!/bin/ksh
while (read filepath)
do    
    /software/Linux/itt/idl/idl81/bin/idl -e program -args "$filepath"
done < "$1"

它简单、优雅,并且应该像魅力一样发挥作用。赶紧跑./runIDL 文件.txt就是这样!

答案2

GNU Parallel 可能适合您:

cat files.txt | parallel /software/Linux/itt/idl/idl81/bin/idl -e program -args {}

默认情况下,每个 CPU 核心有 1 个进程,并确保两个并行作业的输出不会混合。

GNU Parallel 是一个通用并行器,可以轻松地在同一台计算机或多台您可以通过 ssh 访问的计算机上并行运行作业。它通常可以代替for循环。

如果您想要在 4 个 CPU 上运行 32 个不同的作业,则并行化的直接方法是在每个 CPU 上运行 8 个作业:

简单的调度

相反,GNU Parallel 在完成后会生成一个新进程 - 保持 CPU 处于活动状态,从而节省时间:

GNU 并行调度

安装

如果您的发行版未打包 GNU Parallel,您可以进行个人安装,不需要 root 访问权限。这样做可以在 10 秒内完成:

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

对于其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README

了解更多

查看更多示例:http://www.gnu.org/software/parallel/man.html

观看介绍视频:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

浏览本教程:http://www.gnu.org/software/parallel/parallel_tutorial.html

注册电子邮件列表以获得支持:https://lists.gnu.org/mailman/listinfo/parallel

相关内容