就像 Windows 10 会搜索 pdf 等文件内容一样,有没有办法将其转换为 OCR 并在图像内搜索?
尤其是我在网站或其他文本文件夹中有很多屏幕截图等,它们以 jpeg 文件的形式存储。有没有办法让 Windows 搜索这些文件?
或者,是否有任何其他工具或插件可以在 Windows 上完成此操作或可以向图像添加元数据,以便本机 Windows 索引器仍然可以搜索到它们?
答案1
我看到的解决方案之一是,如果你在截图时解析图像,将结果保存在本地数据库或同名图像旁边的文本文件中。这样,你就可以查询截图中的文本
答案2
我不认为有内置的解决方案,但我最近偶然发现了在图片中搜索文字应用程序,但还没有时间尝试。
描述:
该应用程序有一个 OCR 过滤器,可以从任何图像中提取文本并在本地设备上搜索图像中的文本。这允许您搜索单词并将出现该短语的所有结果显示为图像。它仅在本地设备上运行并保护您的隐私。
非常有用,可以查找文档、发票、Wi-Fi 密码以及通过拍照保存的任何其他内容。
答案3
Windows 文件中的搜索由 Windows 的“文本”搜索索引提供。某些文件格式(如 PDF、Docx 等)经过编码,需要 Windows 特定的搜索插件(称为“iFilter”,它解析文件的文本内容,以便索引存储这些关键字,从而实现快速的纯文本检索。
- 对于 PDF,有几种变体,例如 Acrobat 提供的变体。Apryse 也提供了一个很好的变体PDFlib(私人使用免费)
- 对于 DocX 等,它们由 Office 安装
没有自然的像素 iFilter,除非 Microsoft 提供。
- 如果您有 PDF 过滤器,最好的解决方案是扫描为可搜索的 PDF(可以通过 tesseract 或任何 OCR 相关的图像软件完成),然后 PDF 的可搜索内容过一段时间就会添加到“文件系统文本搜索”索引中。
- 数据太多会降低搜索速度,因此请对要搜索的文件夹进行分类,以减少需要慢速搜索的文件
- 例如,将所有水电费账单保存在一个文件夹中,然后您可以只在该区域搜索“已付款”或“逾期付款”