我想从 PDF 文件中查找特定文本或单词,并将其替换为其他文本,然后通过命令行创建新的 PDF 文件。我尝试在文本文件上使用sed
、find
、awk
系列,但我想获取 PDF 文件。哪个命令行实用程序可以帮助我?
答案1
使用pdftk
解压缩文件,然后通过编辑sed
,最后重新压缩。
pdftk input.pdf output uncompressed.pdf uncompress
sed -i 's/foo/bar/g' uncompressed.pdf
# uncompressed.pdf now has all the changes
pdftk uncompressed.pdf output changed.pdf compress
当然,图像中的任何文本都不能这样改变。
答案2
一个可能的解决方案可能是这样的......
您可以使用以下工具将 PDF 文件转换为纯文本文件:poppler 实用程序包裹。
可以通过以下方式安装:
sudo apt-get install poppler-utils
将 pdf 文件转换为文本文件
pdftotext /home/USER/Desktop/test.pdf /home/USER/Desktop/test.txt
现在您可以对 pdf 文件进行编辑和替换了。
之后,你可以使用名为杯子-pdf或者文本转PDF。
可能不是完美的解决方案,但应该能够发挥作用。
希望这可以帮助!