如何从浏览器导出带有嵌入超链接的页面?

如何从浏览器导出带有嵌入超链接的页面?

今天发现了一件令人伤心的事。我使用的是 Ubuntu 10.04 LTS。我的客户从事广告行业,她给我安排了一项营销竞赛任务。她希望我访问竞争对手的网站,并将主页导出为 PDF。但是,她希望我使用嵌入的超链接来执行此操作。

事实证明,Ubuntu 10.04 LTS 上的 Firefox(甚至最新的 Chrome)不会在 PDF 网页导出中嵌入超链接。

当然,有几种 Chrome 和 FF 插件可让您导出为 PDF,但这些插件的作用是远程连接到 URL,远程生成 PDF,然后在浏览器中强制下载以从远程位置下载。但这对我来说并不好,因为其中一些竞争对手的页面需要初始登录。这意味着我从这些 FF 或 Chrome 插件打印 PDF 时得到的只是一个登录页面。

有没有办法解决这个问题,修复 Ubuntu 10.04 上损坏的 PDF 打印机?

答案1

要使用的工具称为 wkhtmltopdf,该工具位于存储库中,但由于对某些 qt 库进行了黑客更改,所有编译的存储库版本都没有嵌入链接功能。

因此从存储库安装 wkhtmltopdf 以获取所有依赖项:

sudo apt-get install wkhtmltopdf

然后下载静态版本来自这里。将文件解压到桌面然后移至 bin:

sudo mv Desktop/wkhtmltopdf-i386 /usr/bin/wkhtmltopdf-static

现在您可以使用该工具生成带有链接的pdf文件:

wkhtmltopdf-static http://google.com google.pdf

对于需要登录的网站,您需要通过 Firefox 登录,然后使用导出 Cookiesfirefox 插件。使用 cookies.txt,您可以运行:

wkhtmltopdf-static --cookie-jar cookies.txt http://google.com google.pdf

我知道很多操作需要在命令行上完成,但这是最好的方法,而且您可以获得更多的控制权。wkhtmltopdf 是一个非常强大的工具。

相关内容