我使用的是 18.04 版本,尝试将网页打印为 PDF,如果我从打印菜单中选择“打印到文件”,则打印过程会很顺利。问题是似乎没有办法保留页面上的链接。我尝试了几个不同的网页,但似乎没有效果——从打印对话框打印为 PDF 不会保留任何链接。
我在设置中看不到任何可以触摸的内容,并且此特定页面仅供 Drupal 网站上的登录用户使用,因此我不能仅使用命令行工具来拉取它。
有没有可行的方法将网页打印为 PDF 并保留所有链接?
答案1
假设你正在使用 Firefox,这是一个长期请求(已 12 年,并且仍在继续)。
列出了一些替代方案这篇超级用户帖子,其中包括:
使用 Firefox 的一些扩展
我不想为此添加随机扩展,所以我没有测试任何扩展。
使用
wkhtmltopdf
我遇到了一些奇怪的字体渲染问题(等宽字体的上半部分被截断)。不知道为什么。除此之外,PDF 看起来还不错。一位用户建议使用
pandoc
通过 LaTeX 转换。可能不适用于经过验证的页面。
使用 Chrome/Chromium。
这是我最终做的事情。它是可自动化的:
google-chrome-stable --headless --disable-gpu --run-all-compositor-stages-before-draw --print-to-pdf=some-file.pdf proto://some-uri
您可能可以依靠 Chrome 保存的 cookie 来避免登录问题。