命令行工具从pdf批量提取图像?
我有一个pdf格式的客户端给我的pdf目录。 他们没有图像,但他们在pdf中。
有没有办法使用命令行工具从pdf中提取所有图像,同时保留它的原始文件名?
我查看了这个主题( 使用图层蒙版从PDF中提取图像 ),但这是针对单个图像的。
来自包poppler-utils
的程序pdfimages
可能就是你要找的东西。 从手册页:
Pdfimages读取PDF文件PDF文件,扫描一个或多个页面,并为每个图像写入一个PPM,PBM或JPEG文件。
在较新版本的poppler-utils上有一个提取到jpg或png的all
开关:
pdfimages -all input.pdf images/prefix
将在images文件夹中以prefix-nnn。[png | jpg]的forms输出文件。