如何使某些 PDF 中不可搜索的内容可搜索

如何使某些 PDF 中不可搜索的内容可搜索

虽然我可以通过 Windows 搜索在大多数 PDF 上搜索内容,但偶尔也会遇到内容不可搜索的 PDF 文件;即使它们包含常规、可选择/可复制的文本,且没有格式异常。

例如本文的 PDF 版本:http://www.ncbi.nlm.nih.gov/pubmed/23870130(CellPress 版和 PMC 版均有不可搜索的内容)

有没有办法让所有这些 PDF 都可搜索?还是必须针对每个文档使用特定的解决方案?这些解决方案是什么?

答案1

  1. 首先,确保 Windows 搜索索引已启用,并且 Windows 执行文件内容索引,而不仅仅是属性索引。
  2. 确保 .PDF 包含在索引文件类型中 在此处输入图片描述
  3. 确保存储 PDF 的目录包含在索引位置列表中 在此处输入图片描述
  4. 尝试重新启动 SearchIndexer.exe 进程 在此处输入图片描述
  5. 作为最后的手段,重建索引并重新启动 Windows Search 服务 在此处输入图片描述

在此处输入图片描述

相关内容