如何将网页转换为 PDF?

如何将网页转换为 PDF?

有很多方法可以将网页转换为 PDF(在线服务、书签、打印为 PDF 解决方案等)。

但这些都不能生成可搜索的 PDF。它们似乎都将 HTML 转换为一个巨大的图像。有没有办法将网页转换为可搜索的 PDF?

答案1

我发现转PDF项目,这似乎可以解决问题。它是命令行,因此学习起来有点困难,但也不是太难。

具体来说,要转换网页,请在wkhtmltopdf安装目录中打开命令窗口并执行以下操作:

wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf

该应用程序具有大量选项,旨在根据需要调整输出,但默认设置即可提供相当不错的结果。

答案2

CutePDF 作家使用 GhostScript 进行文本处理,然后使用 ps2pdf 创建可搜索的网页 PDF。如果页面上的文本一开始就是图像,那么这种方法当然行不通。

答案3

打印到 PDF 解决方案有什么问题?我的系统中安装了两台虚拟打印机:PDF 创建器和 Adob​​e Acrobat X 的虚拟打印机。两者都很好用。只要我的 PDF 查看器具有 OCR 功能(这在当今很常见),我就可以轻松地在生成的 PDF 中搜索文本。
如果你想创建文本和 Word 文档之类的东西,你就不能这样做。这是 PDF 格式的局限性,或者说 PDF 格式的工作方式。因此,我们可以在这种格式中嵌入字体等,而无需任何依赖性来使其通用。
而且,我不认为转PDF项目可以生成一个PDF文件,其中的文本可以在不使用OCR技术的情况下进行搜索(因为这会违反PDF规范)。

答案4

这是一个非常好的工具,可以将网页转换为可搜索的 PDF:http://kitpdf.com/web_to_pdf/。尝试一下,看看它是否满足您的需求。

相关内容