我刚刚用网站内容制作了一个 pdf 文件(即打印->导出 pdf->保存)。
目前,我可以搜索文本。我想禁用此选项。事实上,我想将此文件转换为无法进行文本搜索的 pdf 格式。
我怎样才能做到这一点?
答案1
只要您使用 PDF 格式,我猜禁用文本搜索是不可能的。但您可以执行以下操作:
- 将 PDF 页面提取为图像
- 根据图像重新创建 PDF
根据您使用的操作系统,有不同的工具可以做到这一点。例如,在 Linux 下,软件包convert
中的工具ImageMagick
可以做到这一点。
编辑:
基于该convert
工具似乎可以在 Windows 下使用的事实(感谢@moonpoint 的提示),我将添加与 convert 一起使用的命令来实现提取和重新创建(请注意,这是 Linux 命令语法,应该与 Windows 中的语法相同或至少相似):
convert YourFile.pdf YourFile.png
# 将页面提取为图像convert YourFile-*.png YourNewFile.pdf
# 从图像重新创建 PDF
答案2
答案3
还有另一种选择:扰乱字体编码。我的意思是,扰乱嵌入到 PDF 中的字体中的字形代码(并相应地用扰乱的文本替换源文本)。任何 PDF 查看器中的任何复制粘贴工具都会抓取垃圾...
这种方法的好处:
- PDF 文件的大小没有增加,
- 文档的视觉质量不会下降,
- 适用于任何 PDF 查看器。
有一篇论文讨论了这个想法,其中包括工具:http://dx.doi.org/10.13140/RG.2.1.4509.8489
(或者查看这篇文章:https://groups.google.com/forum/#!topic/pdfnet-sdk/luWQmyhRDTw)