有更好的 Wikipedia 页面转 PDF 工具吗?

有更好的 Wikipedia 页面转 PDF 工具吗?

我知道 Wikipedia 有一个可以根据页面创建 PDF 的工具,但我真的想要一个具有以下功能的更好的工具:

  1. 如果目标页面也在书中,则将多页书籍的超链接更改为文章内的书签。
  2. 更好的内容层。
  3. 如果可能的话,自动更新页面...

有什么建议吗?

答案1

哦,这个问题来得正是时候:-)

因为就在昨晚,我使用这个出色的prince实用程序从不同的 Wikipedia 输入文章创建了一个 PDF。该命令仍然在我的 bash 历史记录中:

time prince \
   --verbose \
   --no-author-style \
   --style=http://www.princexml.com/howcome/2008/wikipedia/wiki2.css \
     http://en.wikipedia.org/wiki/Color_management \
     http://en.wikipedia.org/wiki/Gamut \
     http://en.wikipedia.org/wiki/RGB \
     http://en.wikipedia.org/wiki/CMYK \
     http://en.wikipedia.org/wiki/Color_space \
     http://en.wikipedia.org/wiki/ICC_profile \
     http://en.wikipedia.org/wiki/Color_calibration\
     http://en.wikipedia.org/wiki/Linux_color_management \
   --output=prince-colormanagement-wikipedia.pdf

只花了 3 分钟就下载了所有需要的文件(它使用远程 CSS 样式表文件,以及在线获取的免费字体(Gentium)...)并编写了 PDF。

王子下载并且无需注册即可使用。但是,它仍然是一种商业软件:可以免费用于非商业用途——但在这种情况下,您必须忍受 PDF 首页上一个小而不太显眼的徽标。

当您不为该软件付费时,您必须忍受这个小王子标志,它出现在您的 PDF 第一页的右上角:

第一页 PDF 的左上角显示了小“王子”标志……

下面是在 Linux 上的 Acrobat Reader 中显示页面和部分展开的书签窗格的 PDF 的屏幕截图:

由 prince 生成的多篇带书签的维基百科文章的 PDF 截图

如您所见,所有包含的文章的所有书签都在那里。

您还会注意到,prince 正确实现了样式表的 2 列排版。(如果您是 CSS 专家,您可以轻松创建自己的样式表,使用您自己的字体首选项等,根据自己的喜好创建维基百科书籍样式。)

Prince 不仅适用于 Linux,还适用于 Windows、Solaris 和 Mac OS X。


更新:仅与您想要的功能进行比较:

  1. “如果目标页面也在书中,则将多页书籍的超链接更改为文章内的书签。”
    • 此工具确实可以完成您想要的任务。
  2. “更好的内容层。”
    • 说实话,我不明白你这句话的意思。不过,既然你可以破解自己的样式表并让 Prince 将其应用于输出,那么对你来说“更好的内容”就没有限制了。
  3. “如果可能的话,自动更新页面...
    • 您必须根据prince命令行编写自己的脚本才能执行此操作。它将使用 cronjob 检查组成您书籍的任何维基百科文章是否已更改。如果是,请prince再次运行该命令。检查修改的 cronjob 可以使用curl维基百科 API以便查询文章的最后修改日期。

答案2

一个开源替代方案princewkhtmltopdf,可以从以下网址下载这里

要尝试,请在安装后运行:

wkhtmltopdf http://google.com google.pdf

相关内容