递归 HTML 转 PDF

递归 HTML 转 PDF

我有一个具有以下结构的文件夹:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

有许多子文件夹和仅 html 文件...我想仅使用一个命令或不需要所有文件名的简单脚本将它们全部转换为 pdf。

你知道吗

答案1

我建议安装 WKHtmlToPDF 工具http://wkhtmltopdf.org/(移自:http://code.google.com/p/wkhtmltopdf/)。

然后您可以更改到根文件夹并使用 find 和 xargs 来转换它们:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

然后这将使用每个 HTML 文件构建一个 PDF。

答案2

以下命令可以完成一个链接的作业:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

对于多个链接,编写一个循环逐一处理每个链接应该不难。

相关内容