如何将文本层从一个 PDF 移植到另一个 PDF?(在 Windows 中)

如何将文本层从一个 PDF 移植到另一个 PDF?(在 Windows 中)

我有几个 .djvu 格式的文件,文件很小,但不幸的是我的电子阅读器无法显示它。我使用 DjvuToy 将其转换为 PDF,文件大小保持较小;但是,当我使用 Abby FineReader 进行 OCR 并保存时,文件大小会增加大约八倍(只有当文件包含彩色或灰度图像时才会发生这种情况)。所以,我认为可以将第二个文件文本层添加到第一个文件文本层中,这样我就可以同时获得小文件大小和 OCR。我该怎么做?

注意:原始 djvu 文件没有文本层,但如果知道如何直接将 djvu 转换为包含文本的 pdf 那就太好了。

答案1

Ghostscript 可直接用于编辑 PDF 属性,同时保留文本层:

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dColorConversionStrategy=/Gray -dProcessColorModel=/DeviceGray -sOutputFile=output.pdf input.pdf

这里

相关内容