如何运行 pdftotext ... | grep 处理很多文档？

Question 1

直接使用即可pdfgrep：

pdfgrep -n therapy *.pdf

该-n选项将显示每场比赛的页码。

Answer

直接使用即可pdfgrep：

pdfgrep -n therapy *.pdf

该-n选项将显示每场比赛的页码。

Question 2

你可以试试这个；

pdfgrep therapy *.pdf

或者

find /tmp -name '*.pdf' -exec pdfgrep test {} +

例如;

user@host $ pdfgrep test *.pdf 
1.pdf:test1
1.pdf:test2
1.pdf:test3
2.pdf:test1
2.pdf:test2
2.pdf:test3
test (copy).pdf:test1
test (copy).pdf:test2
test (copy).pdf:test3


user@host $ find /tmp -name '*.pdf' -exec pdfgrep test {} +
/tmp/test (copy).pdf:test1
/tmp/test (copy).pdf:test2
/tmp/test (copy).pdf:test3
/tmp/1.pdf:test1
/tmp/1.pdf:test2
/tmp/1.pdf:test3
/tmp/2.pdf:test1
/tmp/2.pdf:test2
/tmp/2.pdf:test3

Answer

你可以试试这个；

pdfgrep therapy *.pdf

或者

find /tmp -name '*.pdf' -exec pdfgrep test {} +

例如;

user@host $ pdfgrep test *.pdf 
1.pdf:test1
1.pdf:test2
1.pdf:test3
2.pdf:test1
2.pdf:test2
2.pdf:test3
test (copy).pdf:test1
test (copy).pdf:test2
test (copy).pdf:test3


user@host $ find /tmp -name '*.pdf' -exec pdfgrep test {} +
/tmp/test (copy).pdf:test1
/tmp/test (copy).pdf:test2
/tmp/test (copy).pdf:test3
/tmp/1.pdf:test1
/tmp/1.pdf:test2
/tmp/1.pdf:test3
/tmp/2.pdf:test1
/tmp/2.pdf:test2
/tmp/2.pdf:test3

如何运行 pdftotext ... | grep 处理很多文档？

答案1

答案2

相关内容