GNU Parallel - grep n 行查找 m 正则表达式

Question

这是由于 GNU Parallel --pipe 速度慢。

cat bigfile |  parallel --pipe -L1000 --round-robin grep -f regexp.txt -

最大速度约为 100 MB/s。

在手册页示例中，您还会发现：

parallel --pipepart --block 100M -a bigfile grep -f regexp.txt

其性能接近相同，但在 64 核系统上最高可达 20 GB/s。

parallel --pipepart --block 100M -a bigfile -k grep -f regexp.txt

应该给出完全相同的结果grep -f regexp.txt bigfile

Answer 1

这是由于 GNU Parallel --pipe 速度慢。

cat bigfile |  parallel --pipe -L1000 --round-robin grep -f regexp.txt -

最大速度约为 100 MB/s。

在手册页示例中，您还会发现：

parallel --pipepart --block 100M -a bigfile grep -f regexp.txt

其性能接近相同，但在 64 核系统上最高可达 20 GB/s。

parallel --pipepart --block 100M -a bigfile -k grep -f regexp.txt

应该给出完全相同的结果grep -f regexp.txt bigfile

相关内容