如何禁用 pdf 文件上的文本搜索？

2024-6-16 • tag-icon

如何禁用 pdf 文件上的文本搜索？

我刚刚用网站内容制作了一个 pdf 文件（即打印->导出 pdf->保存）。

目前，我可以搜索文本。我想禁用此选项。事实上，我想将此文件转换为无法进行文本搜索的 pdf 格式。

我怎样才能做到这一点？

答案1

只要您使用 PDF 格式，我猜禁用文本搜索是不可能的。但您可以执行以下操作：

将 PDF 页面提取为图像
根据图像重新创建 PDF

根据您使用的操作系统，有不同的工具可以做到这一点。例如，在 Linux 下，软件包convert中的工具ImageMagick可以做到这一点。

编辑： 基于该convert工具似乎可以在 Windows 下使用的事实（感谢@moonpoint 的提示），我将添加与 convert 一起使用的命令来实现提取和重新创建（请注意，这是 Linux 命令语法，应该与 Windows 中的语法相同或至少相似）：

convert YourFile.pdf YourFile.png# 将页面提取为图像
convert YourFile-*.png YourNewFile.pdf# 从图像重新创建 PDF

答案2

无法禁用 PDF 内部的文本搜索。

您可以使用的一个选项是将它们渲染为图像。

但如果你这样做是为了阻止盗版或侵权，你应该考虑禁用复制粘贴和打印。

以下说明

答案3

还有另一种选择：扰乱字体编码。我的意思是，扰乱嵌入到 PDF 中的字体中的字形代码（并相应地用扰乱的文本替换源文本）。任何 PDF 查看器中的任何复制粘贴工具都会抓取垃圾...

这种方法的好处：

PDF 文件的大小没有增加，
文档的视觉质量不会下降，
适用于任何 PDF 查看器。

有一篇论文讨论了这个想法，其中包括工具：http://dx.doi.org/10.13140/RG.2.1.4509.8489

（或者查看这篇文章：https://groups.google.com/forum/#!topic/pdfnet-sdk/luWQmyhRDTw）

相关内容