是否可以将扫描的 pdf 转换为普通 pdf(即与从文档(带有格式化文本和图像)创建的 pdf 相同)?
我在线/离线尝试了许多 OCR 解决方案,但它们往往会丢失格式和/或图像
我发现最好的一个是ocrmypdf 但它会将 OCR 文本放在扫描的 pdf 上
是否可以将扫描的 pdf 转换为普通 pdf(即与从文档(带有格式化文本和图像)创建的 pdf 相同)?
我在线/离线尝试了许多 OCR 解决方案,但它们往往会丢失格式和/或图像
我发现最好的一个是ocrmypdf 但它会将 OCR 文本放在扫描的 pdf 上