在数百万个文件中以更有效的方式查找文件内容

Question

您可以测试类似

time head -12 <(yes "1") | xargs -n1 -P4 sleep

这将运行 12 个sleep 1命令，其中 4 个是并行的。该命令将花费 3 秒。
对于您的情况：

find . -type f -name "^FR_ghi*" | xargs -n1 -P4 grep -l TEXT

我不知道您有多少个 CPU 线程，也许 -P8 也是可行的。
当命令受 I/O 限制时，这可能没什么帮助。在这种情况下，将所有xml文件存储为 gzip 格式并使用可能会很有趣zgrep。

Answer 1

您可以测试类似

time head -12 <(yes "1") | xargs -n1 -P4 sleep

这将运行 12 个sleep 1命令，其中 4 个是并行的。该命令将花费 3 秒。
对于您的情况：

find . -type f -name "^FR_ghi*" | xargs -n1 -P4 grep -l TEXT

我不知道您有多少个 CPU 线程，也许 -P8 也是可行的。
当命令受 I/O 限制时，这可能没什么帮助。在这种情况下，将所有xml文件存储为 gzip 格式并使用可能会很有趣zgrep。

相关内容