递归HTML到PDF
我有一个这种结构的文件夹:
/main-folder /index.html /subfolder1 /index1.html /file1.html
有许多子文件夹和只有html文件…我想只使用一个命令或不需要所有文件名的简单脚本将它们转换为pdf。
你知道吗?
我建议从http://wkhtmltopdf.org/安装WKHtmlToPDF工具(移动自: http : //code.google.com/p/wkhtmltopdf/ )。
然后,您可以更改为根文件夹并使用find和xargs进行转换:
cd /main-folder find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf
然后,这将使用每个HTML文件构建PDF。
以下命令应该为一个链接执行任务:
gnome-web-print http://www.ubuntu.com ubuntu.pdf
对于多个链接,编写一个逐个处理每个链接的循环应该不难。