将扫描文本替换为 PDF 中的 ORed 文本

将扫描文本替换为 PDF 中的 ORed 文本

我有一本 PDF 格式的扫描书。

在 Evince 中查看时,该书的显示方式与扫描时的显示方式相同,并且使用扫描时显示的老式字体。

但是,Evince 将这些字母识别为字符,并且我能够选择、剪切和复制文本。

然而,文件大小非常大,我不关心原始字体类型;我想用 OCRed 文本替换原始文本,以便减小文件大小。然而,书中有图像和格式,我不希望它们被删除。

这可能吗?

相关内容