从命令行在 PDF 文件中查找并替换

从命令行在 PDF 文件中查找并替换

我想从 PDF 文件中查找特定文本或单词,并将其替换为其他文本,然后通过命令行创建新的 PDF 文件。我尝试在文本文件上使用sedfindawk系列,但我想获取 PDF 文件。哪个命令行实用程序可以帮助我?

答案1

使用pdftk解压缩文件,然后通过编辑sed,最后重新压缩。

pdftk input.pdf output uncompressed.pdf uncompress
sed -i 's/foo/bar/g' uncompressed.pdf
# uncompressed.pdf now has all the changes
pdftk uncompressed.pdf output changed.pdf compress

当然,图像中的任何文本都不能这样改变。

答案2

一个可能的解决方案可能是这样的......

您可以使用以下工具将 PDF 文件转换为纯文本文件:poppler 实用程序包裹。

可以通过以下方式安装:

sudo apt-get install poppler-utils

将 pdf 文件转换为文本文件

pdftotext /home/USER/Desktop/test.pdf /home/USER/Desktop/test.txt

现在您可以对 pdf 文件进行编辑和替换了。

之后,你可以使用名为杯子-pdf或者文本转PDF

可能不是完美的解决方案,但应该能够发挥作用。

希望这可以帮助!

相关内容