ocr

歌剧和巴比伦

当我在 Opera 中点击一个单词时，巴比伦（上一版本）没有捕捉到正确的单词。如何解决？ ...

Admin 2024-12-9

ocr

如何使用 Epson Stylus Office BX635FWD 的双面扫描和 OCR？

我使用的是旧款 Epson Stylus Office BX635FWD。它支持双面扫描。但在扫描软件的设置中，我没有找到任何文本识别的配置。有可能吗/如何实现 OCR和使用 BX635FWD 进行双面扫描？ ...

Admin 2024-12-8

ocr

照片 OCR 到文件名

我有大量包含文本的图像文件，我想知道是否有办法运行 OCR 扫描并根据 OCR 扫描详细信息批量更改文件名。Windows 10 谢谢您的帮助。 ...

Admin 2024-12-5

ocr

tesseract ocr：为什么当我将包含计算机数字的 png 图像 ocr 到文本文件时会返回垃圾信息？

我已经安装了 tesseract ocr 5.3.0（在 Debian 12 上）我想扫描并对该 png 文件进行 OCR 处理：当我执行： tesseract cp1.png cp1 输出cp1.txt包含意外的垃圾： y seeseeggegegegenagesseagegs feésidaedsdcsdasaredadacd sgsessesesssesagess B isgsddsadsdecansas geverdcdessaguce sses SERRRERRRRSRSRSERRRERSEsesR an 为什么？ ...

Admin 2024-12-1

ocr

混合数学和文本的 OC 文档

我有一份包含数学方程式的文档，我想用谷歌翻译将其翻译成另一种语言。如果这是一份带有图片的文本文档，我会使用任何 OCR 软件，将文本复制粘贴到谷歌翻译中，并忽略图片。本文档有所不同，因为：由于方程式部分为文本，因此可能被 OCR 部分识别，但如果方程式没有完全按原样再现（例如，简单地将下标改为上标就会改变含义），文章的含义就会发生变化。数学有几百种，所以处理数学的过程必须可靠（在某种意义上）。所以我的想法是尝试编写一个可以对文本进行 OCR 处理的脚本。至于方程式，找到某种方法将它们自动转换为图像，并在使用谷歌翻译翻译后将这些图像自动插入字符串之间...

Admin 2024-11-30

ocr

NAPS2 扫描时自动检测图像

有什么方法可以检测图像吗？我有 HP LaserJet Pro MFP M28 打印机/扫描仪，我有一些不同大小的图片需要扫描。我可以设置 NAPS2 自动检测整个画布中的图像吗？ ...

Admin 2024-11-24

ocr

使用 ocrmypdf 进行数字识别

我想使用 ocrmypdf 从该图像中获取“5”：我试过： ocrmypdf digit.png --output-type none --image-dpi 300 --sidecar side.txt - > /dev/null 但什么也没有，sidecar 是空的，并且在 stderr 中打印文件是空的。在将图像传递给 ocrmypdf 之前，我也尝试使用 ImageMagick 对其进行升级，但仍然没有任何效果。 ...

Admin 2024-11-20

ocr

如何在不编程的情况下使用 Azure Vision 对大量图像进行 OCR？

我有大约 500 张图像，我确实想使用 Microsoft Azure Vision 对这些图像进行 OCR。由于某种原因，我目前无法访问 Azure 帐户。我可以使用 Microsoft Azure Vision 对图片进行 OCR 处理，无需编程和 Azure 帐户吗？例如，我可以使用https://portal.vision.cognitive.azure.com/demo/extract-text-from-images但我必须逐张上传图片并进行 OCR。我没有足够的时间，我必须自动完成。我甚至尝试过OneNote这样做，但它不适用于数值，只适...

Admin 2024-11-16

ocr

如何提高扫描的 PDF 图像中像素化文本的质量并将其转换为非像素化的高质量数字文本？

我有一个扫描的 PDF 文档，其中包含带有像素化文本的图像。OCR 过程已提取文本，但文本看起来质量较差且像素化。我想将此像素化文本转换为高质量的数字字体或矢量格式，以保持其清晰度和流畅度。我已经尝试过光学字符识别 (OCR)，可以复制文本，但质量不够理想。扫描图像中的文本看起来参差不齐且模糊，难以阅读。我想提高文本质量，并将其转换为清晰、无像素化的数字字体或矢量格式。我可以使用哪些步骤和工具来增强扫描 PDF 图像中的像素化文本？是否有任何特定软件或技术可以帮助我实现此目的？此外，将改进后的文本转换为高质量数字字体或矢量格式的最佳做法是什么？任何有关...

Admin 2024-11-15

ocr

通过 Windows 搜索面板搜索 DJVU 文件中的文本

我在一个文件夹中有许多带 OCR 的 DJVU 文件。我应该怎么做，或者如何通过文件夹中的搜索字段（左上角）搜索这些文件中的单词？互联网上有一个由 Vladimir Levenshtein 编写的适用于 Windows 的 DjVuOCR 插件的参考资料，但我找不到它。将 798 个 DJVU 文件转换为带 OCR 的 PDF 是不可行的。感谢您的帮助。 ...

Admin 2024-11-10

ocr

我可以使用 gImageReader 注释 PDF 以使其可搜索吗？

我正在使用最新版本的 gImageMaker (3-2023，Windows 10)。OCR 运行良好。我使用 PDF 作为源，但它不可搜索，我只想将 OCR 文本添加到 PDF 以便可以搜索。到目前为止，我只能用文本创建新的 PDF。但我想保留原始 PDF，只用 OCR 文本进行注释。有机会使用 gImageMaker 来做到这一点吗？参考：如何搜索仅包含图像的文本的 PDF？寻找适用于 Windows 的 PDF 文档的优质注释工具 ...

Admin 2024-11-7

ocr

修复 PDF 中的模糊文本

我有一个包含文本和图像的 PDF。图像还可以，但文本很模糊，带有“像素化”图案，很难阅读。如果我将文本从 Adobe Acrobat 复制粘贴到另一个应用程序（例如 Microsoft Word），文本完全正常，没有任何错误。此外，当我在 Acrobat 中放大/缩小 PDF 时，有一瞬间（我想是因为 Acrobat 正在重新加载页面），我可以看到清晰的文本。所以我认为 Acrobat 实际上可以识别文本，但不知何故它无法正确显示它。有什么方法可以修复 PDF 吗？ ...

Admin 2024-10-30

ocr

如何撤消 Foxit 中的 OCR？

Foxit 中的光学字符识别 (OCR) 有时会弄乱字体。例如，在 OCR 之前：经过 OCR 处理后：如何在 Foxit 中撤消 OCR？Ctrl+Z 无法撤消 OCR。我在 Windows 10 上使用 Foxit 11.2。在 OCR 之前，我对 PDF 做了一些未保存的更改。 ...

Admin 2024-10-30

ocr

OCRmyPDF 无法转换带有水印的页面

我有一些扫描的杂志，有些页面上有粉色水印。我需要对它们进行 OCR 处理，OCR我的PDF似乎是完成这项工作的合适工具。但它无法转换水印上的文本。我有准备了一个示例页面已经由ocrmypdf处理过。让我们尝试在第二行搜索单词“forbindelse”（丹麦语中的连接）。您可以找到“forbind”，但如果您输入下一个字母 e，则不会匹配，因为单词的其余部分位于水印上方。奇怪的是，它似乎也难以将文本转换到水印的右侧。例如，它无法在第 8 行找到单词“max”，但在同一行找到“Output”，因为它位于水印之前。您也可以通过双击水印后面的许多单词来查看它。...

Admin 2024-10-28

ocr

如何使 PDF 和内容在 Onenote 中再次可搜索

一年前，我可以非常有效地使用每个 OneNote 文档中的搜索选项（更准确地说，我使用的是“OneNote for Windows 10”（软件版本）），它可以在我插入的 pdf 中找到单词，甚至可以识别我的（丑陋的）笔迹。奇怪的是，这个非常有用的功能几个月前就停止工作了。现在，它除了键盘输入的单词外，什么都找不到（有点没用，因为我的文档中大多没有这些单词）。我的所有讲座（数千页……）都在 OneNote 中，这真的很不方便。当搜索某个主题时，我必须在 Adobe 中单独打开 PDF，然后进行搜索，然后返回 OneNote 并向下滚动，直到找到相应的...

Admin 2024-10-26