无法搜索、无法复制的 PDF 文档

Question 1

此 PDF 可能包含嵌入其中的自有字体。在这种情况下，尽管 PDF 仍能正确显示，但正确的文本信息并不总是可用的，并且无法进行复制。

字体实际上都是嵌入的，但所有编码信息都已被删除。当一个在语法上仍然完全符合 PDF 规范的 PDF 在制作 PDF 的过程中丢失了有关其中文本含义的重要信息时，就会发生这种情况。恢复编码信息非常困难，有时最好的选择是将页面转换为 TIFF，然后运行 OCR...

您可以尝试使用 PDF 到 Word 转换器，例如AnyBizSoft或网站转换器转换后，您可以从 word 或文本文件中获取任何您想要的内容。以下是分步说明教程对于 AnyBizSoft。（许多人推荐 AnyBizSoft，但我个人从未使用过。）

也可以看看最佳免费 PDF 工具获得更多工具和转换器。

Answer

此 PDF 可能包含嵌入其中的自有字体。在这种情况下，尽管 PDF 仍能正确显示，但正确的文本信息并不总是可用的，并且无法进行复制。

字体实际上都是嵌入的，但所有编码信息都已被删除。当一个在语法上仍然完全符合 PDF 规范的 PDF 在制作 PDF 的过程中丢失了有关其中文本含义的重要信息时，就会发生这种情况。恢复编码信息非常困难，有时最好的选择是将页面转换为 TIFF，然后运行 OCR...

您可以尝试使用 PDF 到 Word 转换器，例如AnyBizSoft或网站转换器转换后，您可以从 word 或文本文件中获取任何您想要的内容。以下是分步说明教程对于 AnyBizSoft。（许多人推荐 AnyBizSoft，但我个人从未使用过。）

也可以看看最佳免费 PDF 工具获得更多工具和转换器。

Question 2

使用 Adobe Acrobat Pro 9，我按如下方式处理由于自定义字体编码而导致的无法搜索的问题 pdf：所有这些命令（1-4）都来自文件菜单：

从文档菜单：

但是，使用上述步骤转换后，258 页、1457 KB 大小的 PDF 文档将变成 67565 KB 的 PDF 文件。它变得更大了！但现在可以搜索了。

Answer

使用 Adobe Acrobat Pro 9，我按如下方式处理由于自定义字体编码而导致的无法搜索的问题 pdf：所有这些命令（1-4）都来自文件菜单：

从文档菜单：

但是，使用上述步骤转换后，258 页、1457 KB 大小的 PDF 文档将变成 67565 KB 的 PDF 文件。它变得更大了！但现在可以搜索了。

Question 3

迄今为止最好的解决方案！如果您不介意质量略有下降的话……

1）使用光栅化第三方 PDF 打印机（我使用的是 Win2PDF）。最终结果基本上是原始 PDF 的扫描件，删除了字体数据。

2）从文档（顶部栏）菜单运行光学字符识别（OCR）文本识别工具。

最终结果是可搜索的 PDF（尽管看上去有些粗糙）。OCR 会使文件中的字符变得粗糙。但它们确实可搜索和复制/粘贴。

享受。

Answer

迄今为止最好的解决方案！如果您不介意质量略有下降的话……

1）使用光栅化第三方 PDF 打印机（我使用的是 Win2PDF）。最终结果基本上是原始 PDF 的扫描件，删除了字体数据。

2）从文档（顶部栏）菜单运行光学字符识别（OCR）文本识别工具。

最终结果是可搜索的 PDF（尽管看上去有些粗糙）。OCR 会使文件中的字符变得粗糙。但它们确实可搜索和复制/粘贴。

享受。

Question 4

也许可以尝试在线（或离线） OCR 工具？

Answer

也许可以尝试在线（或离线） OCR 工具？

相关内容