如何禁用 pdf 文件上的文本搜索?

如何禁用 pdf 文件上的文本搜索?

我刚刚用网站内容制作了一个 pdf 文件(即打印->导出 pdf->保存)。

目前,我可以搜索文本。我想禁用此选项。事实上,我想将此文件转换为无法进行文本搜索的 pdf 格式。

我怎样才能做到这一点?

答案1

只要您使用 PDF 格式,我猜禁用文本搜索是不可能的。但您可以执行以下操作:

  1. 将 PDF 页面提取为图像
  2. 根据图像重新创建 PDF

根据您使用的操作系统,有不同的工具可以做到这一点。例如,在 Linux 下,软件包convert中的工具ImageMagick可以做到这一点。

编辑: 基于该convert工具似乎可以在 Windows 下使用的事实(感谢@moonpoint 的提示),我将添加与 convert 一起使用的命令来实现提取和重新创建(请注意,这是 Linux 命令语法,应该与 Windows 中的语法相同或至少相似):

  1. convert YourFile.pdf YourFile.png# 将页面提取为图像
  2. convert YourFile-*.png YourNewFile.pdf# 从图像重新创建 PDF

答案2

无法禁用 PDF 内部的文本搜索。

您可以使用的一个选项是将它们渲染为图像。

但如果你这样做是为了阻止盗版或侵权,你应该考虑禁用复制粘贴和打印

以下说明

在此处输入图片描述

答案3

还有另一种选择:扰乱字体编码。我的意思是,扰乱嵌入到 PDF 中的字体中的字形代码(并相应地用扰乱的文本替换源文本)。任何 PDF 查看器中的任何复制粘贴工具都会抓取垃圾...

这种方法的好处:

  • PDF 文件的大小没有增加,
  • 文档的视觉质量不会下降,
  • 适用于任何 PDF 查看器。

有一篇论文讨论了这个想法,其中包括工具:http://dx.doi.org/10.13140/RG.2.1.4509.8489

(或者查看这篇文章:https://groups.google.com/forum/#!topic/pdfnet-sdk/luWQmyhRDTw

相关内容