使用 ocrmypdf 进行数字识别
我想使用 ocrmypdf 从该图像中获取“5”: 我试过: ocrmypdf digit.png --output-type none --image-dpi 300 --sidecar side.txt - > /dev/null 但什么也没有,sidecar 是空的,并且在 stderr 中打印文件是空的。 在将图像传递给 ocrmypdf 之前,我也尝试使用 ImageMagick 对其进行升级,但仍然没有任何效果。 ...
我想使用 ocrmypdf 从该图像中获取“5”: 我试过: ocrmypdf digit.png --output-type none --image-dpi 300 --sidecar side.txt - > /dev/null 但什么也没有,sidecar 是空的,并且在 stderr 中打印文件是空的。 在将图像传递给 ocrmypdf 之前,我也尝试使用 ImageMagick 对其进行升级,但仍然没有任何效果。 ...
我有大约 500 张图像,我确实想使用 Microsoft Azure Vision 对这些图像进行 OCR。 由于某种原因,我目前无法访问 Azure 帐户。 我可以使用 Microsoft Azure Vision 对图片进行 OCR 处理,无需编程和 Azure 帐户吗? 例如,我可以使用https://portal.vision.cognitive.azure.com/demo/extract-text-from-images但我必须逐张上传图片并进行 OCR。我没有足够的时间,我必须自动完成。我甚至尝试过OneNote这样做,但它不适用于数值,只适...
我有一个扫描的 PDF 文档,其中包含带有像素化文本的图像。OCR 过程已提取文本,但文本看起来质量较差且像素化。我想将此像素化文本转换为高质量的数字字体或矢量格式,以保持其清晰度和流畅度。 我已经尝试过光学字符识别 (OCR),可以复制文本,但质量不够理想。扫描图像中的文本看起来参差不齐且模糊,难以阅读。我想提高文本质量,并将其转换为清晰、无像素化的数字字体或矢量格式。 我可以使用哪些步骤和工具来增强扫描 PDF 图像中的像素化文本?是否有任何特定软件或技术可以帮助我实现此目的?此外,将改进后的文本转换为高质量数字字体或矢量格式的最佳做法是什么? 任何有关...
我在一个文件夹中有许多带 OCR 的 DJVU 文件。我应该怎么做,或者如何通过文件夹中的搜索字段(左上角)搜索这些文件中的单词?互联网上有一个由 Vladimir Levenshtein 编写的适用于 Windows 的 DjVuOCR 插件的参考资料,但我找不到它。将 798 个 DJVU 文件转换为带 OCR 的 PDF 是不可行的。感谢您的帮助。 ...
我正在使用最新版本的 gImageMaker (3-2023,Windows 10)。OCR 运行良好。 我使用 PDF 作为源,但它不可搜索,我只想将 OCR 文本添加到 PDF 以便可以搜索。 到目前为止,我只能用文本创建新的 PDF。但我想保留原始 PDF,只用 OCR 文本进行注释。 有机会使用 gImageMaker 来做到这一点吗? 参考: 如何搜索仅包含图像的文本的 PDF? 寻找适用于 Windows 的 PDF 文档的优质注释工具 ...
我有一个包含文本和图像的 PDF。图像还可以,但文本很模糊,带有“像素化”图案,很难阅读。如果我将文本从 Adobe Acrobat 复制粘贴到另一个应用程序(例如 Microsoft Word),文本完全正常,没有任何错误。此外,当我在 Acrobat 中放大/缩小 PDF 时,有一瞬间(我想是因为 Acrobat 正在重新加载页面),我可以看到清晰的文本。所以我认为 Acrobat 实际上可以识别文本,但不知何故它无法正确显示它。 有什么方法可以修复 PDF 吗? ...
Foxit 中的光学字符识别 (OCR) 有时会弄乱字体。例如,在 OCR 之前: 经过 OCR 处理后: 如何在 Foxit 中撤消 OCR?Ctrl+Z 无法撤消 OCR。我在 Windows 10 上使用 Foxit 11.2。在 OCR 之前,我对 PDF 做了一些未保存的更改。 ...
我有一些扫描的杂志,有些页面上有粉色水印。我需要对它们进行 OCR 处理,OCR我的PDF似乎是完成这项工作的合适工具。但它无法转换水印上的文本。 我有准备了一个示例页面已经由ocrmypdf处理过。 让我们尝试在第二行搜索单词“forbindelse”(丹麦语中的连接)。您可以找到“forbind”,但如果您输入下一个字母 e,则不会匹配,因为单词的其余部分位于水印上方。 奇怪的是,它似乎也难以将文本转换到水印的右侧。例如,它无法在第 8 行找到单词“max”,但在同一行找到“Output”,因为它位于水印之前。您也可以通过双击水印后面的许多单词来查看它。...
一年前,我可以非常有效地使用每个 OneNote 文档中的搜索选项(更准确地说,我使用的是“OneNote for Windows 10”(软件版本)),它可以在我插入的 pdf 中找到单词,甚至可以识别我的(丑陋的)笔迹。 奇怪的是,这个非常有用的功能几个月前就停止工作了。现在,它除了键盘输入的单词外,什么都找不到(有点没用,因为我的文档中大多没有这些单词)。 我的所有讲座(数千页……)都在 OneNote 中,这真的很不方便。当搜索某个主题时,我必须在 Adobe 中单独打开 PDF,然后进行搜索,然后返回 OneNote 并向下滚动,直到找到相应的...
我收到一份手填的复选框表格: 想象一下,每行都有 X,用笔标记表示所选的答案。 我寻找某种可以将扫描的表格转换为 excel 或 csv 格式的软件。 ...
我有一些包含 HDMV PGS 字幕的视频文件,我需要将它们转换为 subrip(或其他文本字幕)。我知道我可以使用 ffmpeg 解复用视频文件来提取.sup并即时将其转换为 VobSub,然后subtitleedit /convert使用其自己的 tesseract 将其转换为 subrip。 但是,我只想使用 ffprobe/ffmpeg,我之前已经用 libtesseract 等编译过它。我也不介意将原始 tesseract 输出解析为 subrip,但我只需要获取它。 我已经尝试过例如: ffprobe -show_entries frame_ta...
[示例图片] 我在下面给出的代码中寻求您的指导。我正在运行此代码以将文本从多页 TIFF 提取到 hocr 格式。我从 TIFF 的第一页获得输出,但其余页面被省略。 # Python program to extract text from all the images in a folder # storing the text in corresponding files in a different folder # This is for hocr output, but there is error of getting only 1 page ...
我以传真的形式收到了这些糟糕的发票。我们正在实施 EDI,但接下来的几个月就只能这样了。我让输入数据的员工非常无聊和沮丧。有没有办法将数据从 PDF 提取到 Excel?我只需要黄色的数据。 尽管格式一致,但到目前为止我尝试过的方法都没有奏效: Adobe DC 专业 OCR 在 Word 中打开 PDF 删除黄色以外的所有内容,然后尝试转换为 Excel 我正在考虑使用电力自动化,但我不确定这是否值得付出努力,而不是仅仅外包数据输入。 如果解决方案是软件,我非常愿意付费 示例 PDF: ...
我想使用 Acrobat 将受保护的 PDF 文件打印到另一个 PDF 文件中,以便将来也可以查阅它,并且我想保持文本可搜索:有没有办法使用 Acrobat 做到这一点而不丢失 ocr? 我通过机构访问下载了该文件,并且该文件只能在我的 PC 上通过 Acrobat 打开 14 天。当然,如果我使用 Acrobat 正常将文件打印为 PDF,所有这些限制都会消失,但我失去了进行文本搜索和复制/粘贴文本的能力。 ...
我正在运行 Apache Tika,从一堆 MS Office 文档中提取文本。我的命令如下: java -jar "c:\path\to\tika-app-2.0.0.jar" -t ... (我在 Win10 的 MSYS2 终端上运行此命令)。收到很多类似这样的消息: INFO [main] 08:02:46,683 org.apache.tika.parser.ocr.TesseractOCRParser Tesseract is installed and is being invoked. This can add greatly to pro...