Linux—从 pdf 中删除图片的命令

Linux—从 pdf 中删除图片的命令

我有一个 pdf,由于它是从 photoshop 导出的,所以文件很大,我几乎打不开。它包含文本,我喜欢复制/粘贴。

是否有命令可以从 pdf 中删除所有图像并将结果保存为新文件?

顺便说一句。我已经尝试过了pdftotext,但是生成的文件很乱,行被分解为最多 10 个字符,全是空格等等。

更新

我找到了一个不错的帖子这里但这些解决方案都不起作用,所以我猜 »photoshop pdf« 确实搞砸了……

答案1

根据您要提取的文本,最好运行pdf转txt在上面。

答案2

对发布的解决方案表示赞赏这里,以下将删除图像并为您提供所需的精确结果:

gs -o no-images.pdf -sDEVICE=pdfwrite -dFILTERIMAGE original.pdf

Ghostscript几乎可以在任何 Linux 发行版中使用

相关内容