递归HTML到PDF

我有一个这种结构的文件夹:

/main-folder /index.html /subfolder1 /index1.html /file1.html 

有许多子文件夹和只有html文件…我想只使用一个命令或不需要所有文件名的简单脚本将它们转换为pdf。

你知道吗?

我建议从http://wkhtmltopdf.org/安装WKHtmlToPDF工具(移动自: http : //code.google.com/p/wkhtmltopdf/ )。

然后,您可以更改为根文件夹并使用find和xargs进行转换:

 cd /main-folder find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf 

然后,这将使用每个HTML文件构建PDF。

以下命令应该为一个链接执行任务:

 gnome-web-print http://www.ubuntu.com ubuntu.pdf 

对于多个链接,编写一个逐个处理每个链接的循环应该不难。