使用 GNU 并行基于行的输出，无需临时文件

Question 1

要执行您的建议，需要lz4将每个管道的输出发送到单独的管道，并且需要一个从所有管道读取并将其输出拆分为几行的选择/轮询循环，或者让一个进程/线程处理每个管道。

这听起来像是一笔巨大的开销。即使没有这种开销，我发现在我的 12 年历史的 4 核 8 线程笔记本电脑上，带有快速 SSD printf '%s\0' /var/lib/apt/lists/*lz4 | xargs -r0 -n 1 -P8 lz4 -dc（即使没有 GNU 并行开销）也不会比lz4 -dmc /var/lib/apt/lists/*lz4.

理想情况下，您首先希望并行命令输出行缓冲。对于很多，你可以用来做到这一点stdbuf -oL。

但情况似乎并非如此lz4，但您可以通过以下方式手动实现第二种方法（一个进程处理一个lz4输出）：

printf '%s\0' /var/lib/apt/lists/*lz4 |
  stdbuf -oL xargs -r0 -n 1 -P4 sh -c 'lz4 -dc "$1" | paste' sh | 
  wc -c

（paste这是一个一次处理一行输入的命令，并且可以确信对输出进行行缓冲stdbuf，另请参见 GNUgrep的grep --line-buffered '^'；避免sed -u一次输出一行，但一次读取一个字节的输入）。

即使将输出丢弃到/dev/null，在我的系统上，速度也比非并行系统慢 13 倍lz4 -dmc /var/lib/apt/lists/*lz4（6.5 秒 vs 0.5 秒）。

这是使用paste用 C 编写的。GNU 并行是用编写的perl，如果内部确实支持类似的东西，那么很有可能它的效率会更低。

并行化（至少以这种方式）仅对产生相对较少文本输出的 CPU 密集型任务有意义，这lz4与轻松解压缩相反。

Answer

要执行您的建议，需要lz4将每个管道的输出发送到单独的管道，并且需要一个从所有管道读取并将其输出拆分为几行的选择/轮询循环，或者让一个进程/线程处理每个管道。

这听起来像是一笔巨大的开销。即使没有这种开销，我发现在我的 12 年历史的 4 核 8 线程笔记本电脑上，带有快速 SSD printf '%s\0' /var/lib/apt/lists/*lz4 | xargs -r0 -n 1 -P8 lz4 -dc（即使没有 GNU 并行开销）也不会比lz4 -dmc /var/lib/apt/lists/*lz4.

理想情况下，您首先希望并行命令输出行缓冲。对于很多，你可以用来做到这一点stdbuf -oL。

但情况似乎并非如此lz4，但您可以通过以下方式手动实现第二种方法（一个进程处理一个lz4输出）：

printf '%s\0' /var/lib/apt/lists/*lz4 |
  stdbuf -oL xargs -r0 -n 1 -P4 sh -c 'lz4 -dc "$1" | paste' sh | 
  wc -c

（paste这是一个一次处理一行输入的命令，并且可以确信对输出进行行缓冲stdbuf，另请参见 GNUgrep的grep --line-buffered '^'；避免sed -u一次输出一行，但一次读取一个字节的输入）。

即使将输出丢弃到/dev/null，在我的系统上，速度也比非并行系统慢 13 倍lz4 -dmc /var/lib/apt/lists/*lz4（6.5 秒 vs 0.5 秒）。

这是使用paste用 C 编写的。GNU 并行是用编写的perl，如果内部确实支持类似的东西，那么很有可能它的效率会更低。

并行化（至少以这种方式）仅对产生相对较少文本输出的 CPU 密集型任务有意义，这lz4与轻松解压缩相反。

Question 2

20170822 版本的发行说明中写道：

--line-buffer 不再使用临时文件。这速度更快，并且使得单个进程可以输出比可用磁盘空间更多的数据。

所以解决办法就是升级到20170822。

GNU Parallel 仍将临时文件用于其他用途，但不用于行缓冲。

如果您排长队，它也会做正确的事情：

#!/bin/bash

5gfile() {
    # Create file with 5GB long line
    perl -e '$a=(shift)x1000000;for(1..5000){print $a};print "\n"' $1 | lz4 > $1.lz4;
}
export -f 5gfile
parallel 5gfile ::: a b c d

echo The correct output: One line with a b c d
lz4 -dc {a..d}.lz4 | tr -s abcd

echo Output from parallel: One line with a b c d might be reordered
parallel --line-buffer lz4 -dc ::: {a..d}.lz4 |
    tr -s abcd

echo Output from xargs with stdbuf -oL
echo This does not handle long lines because stdbuf -oL does not guarantee only full lines will be written
printf '%s\0' /tmp/*lz4 |
    stdbuf -oL xargs -r0 -n 1 -P4 sh -c 'lz4 -dc "$1" | paste' sh |
    tr -s abcd

Answer

20170822 版本的发行说明中写道：

--line-buffer 不再使用临时文件。这速度更快，并且使得单个进程可以输出比可用磁盘空间更多的数据。

所以解决办法就是升级到20170822。

GNU Parallel 仍将临时文件用于其他用途，但不用于行缓冲。

如果您排长队，它也会做正确的事情：

#!/bin/bash

5gfile() {
    # Create file with 5GB long line
    perl -e '$a=(shift)x1000000;for(1..5000){print $a};print "\n"' $1 | lz4 > $1.lz4;
}
export -f 5gfile
parallel 5gfile ::: a b c d

echo The correct output: One line with a b c d
lz4 -dc {a..d}.lz4 | tr -s abcd

echo Output from parallel: One line with a b c d might be reordered
parallel --line-buffer lz4 -dc ::: {a..d}.lz4 |
    tr -s abcd

echo Output from xargs with stdbuf -oL
echo This does not handle long lines because stdbuf -oL does not guarantee only full lines will be written
printf '%s\0' /tmp/*lz4 |
    stdbuf -oL xargs -r0 -n 1 -P4 sh -c 'lz4 -dc "$1" | paste' sh |
    tr -s abcd

使用 GNU 并行基于行的输出，无需临时文件

答案1

答案2

相关内容