我知道 Wikipedia 有一个可以根据页面创建 PDF 的工具,但我真的想要一个具有以下功能的更好的工具:
- 如果目标页面也在书中,则将多页书籍的超链接更改为文章内的书签。
- 更好的内容层。
- 如果可能的话,自动更新页面...
有什么建议吗?
答案1
哦,这个问题来得正是时候:-)
因为就在昨晚,我使用这个出色的prince
实用程序从不同的 Wikipedia 输入文章创建了一个 PDF。该命令仍然在我的 bash 历史记录中:
time prince \
--verbose \
--no-author-style \
--style=http://www.princexml.com/howcome/2008/wikipedia/wiki2.css \
http://en.wikipedia.org/wiki/Color_management \
http://en.wikipedia.org/wiki/Gamut \
http://en.wikipedia.org/wiki/RGB \
http://en.wikipedia.org/wiki/CMYK \
http://en.wikipedia.org/wiki/Color_space \
http://en.wikipedia.org/wiki/ICC_profile \
http://en.wikipedia.org/wiki/Color_calibration\
http://en.wikipedia.org/wiki/Linux_color_management \
--output=prince-colormanagement-wikipedia.pdf
只花了 3 分钟就下载了所有需要的文件(它使用远程 CSS 样式表文件,以及在线获取的免费字体(Gentium)...)并编写了 PDF。
王子可下载并且无需注册即可使用。但是,它仍然是一种商业软件:可以免费用于非商业用途——但在这种情况下,您必须忍受 PDF 首页上一个小而不太显眼的徽标。
当您不为该软件付费时,您必须忍受这个小王子标志,它出现在您的 PDF 第一页的右上角:
下面是在 Linux 上的 Acrobat Reader 中显示页面和部分展开的书签窗格的 PDF 的屏幕截图:
如您所见,所有包含的文章的所有书签都在那里。
您还会注意到,prince 正确实现了样式表的 2 列排版。(如果您是 CSS 专家,您可以轻松创建自己的样式表,使用您自己的字体首选项等,根据自己的喜好创建维基百科书籍样式。)
Prince 不仅适用于 Linux,还适用于 Windows、Solaris 和 Mac OS X。
更新:仅与您想要的功能进行比较:
- “如果目标页面也在书中,则将多页书籍的超链接更改为文章内的书签。”
- 此工具确实可以完成您想要的任务。
- “更好的内容层。”
- 说实话,我不明白你这句话的意思。不过,既然你可以破解自己的样式表并让 Prince 将其应用于输出,那么对你来说“更好的内容”就没有限制了。
- “如果可能的话,自动更新页面...“
- 您必须根据
prince
命令行编写自己的脚本才能执行此操作。它将使用 cronjob 检查组成您书籍的任何维基百科文章是否已更改。如果是,请prince
再次运行该命令。检查修改的 cronjob 可以使用curl
和维基百科 API以便查询文章的最后修改日期。
- 您必须根据