将扫描的 pdf 转换为包含文本和图像的 pdf

将扫描的 pdf 转换为包含文本和图像的 pdf

是否可以将扫描的 pdf 转换为普通 pdf(即与从文档(带有格式化文本和图像)创建的 pdf 相同)?

我在线/离线尝试了许多 OCR 解决方案,但它们往往会丢失格式和/或图像

我发现最好的一个是ocrmypdf 但它会将 OCR 文本放在扫描的 pdf 上

相关内容