有很多方法可以将网页转换为 PDF(在线服务、书签、打印为 PDF 解决方案等)。
但这些都不能生成可搜索的 PDF。它们似乎都将 HTML 转换为一个巨大的图像。有没有办法将网页转换为可搜索的 PDF?
答案1
我发现转PDF项目,这似乎可以解决问题。它是命令行,因此学习起来有点困难,但也不是太难。
具体来说,要转换网页,请在wkhtmltopdf
安装目录中打开命令窗口并执行以下操作:
wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf
该应用程序具有大量选项,旨在根据需要调整输出,但默认设置即可提供相当不错的结果。
答案2
CutePDF 作家使用 GhostScript 进行文本处理,然后使用 ps2pdf 创建可搜索的网页 PDF。如果页面上的文本一开始就是图像,那么这种方法当然行不通。
答案3
答案4
这是一个非常好的工具,可以将网页转换为可搜索的 PDF:http://kitpdf.com/web_to_pdf/。尝试一下,看看它是否满足您的需求。