哪个是Ubuntu最好的PDF元数据查看器?
关于Ubuntu提供的最佳PDF查看器,有很多问题和答案。 但我想解析PDF文件并了解PDF的详细信息,例如给定PDF文件中可用的图像,字体和链接。
是否有可用的PDF元数据查看器?
-
查看名为Example.pdf的文件的pdf元数据:
pdfinfo Example.pdf
-
使用nano编辑器编辑终端中的现有元数据:
pdftk Example.pdf dump_data output Metadata-output.txt nano Metadata-output.txt
-
更新元数据:
pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
Nano编辑器键盘快捷键
使用键盘组合Ctrl + O ,然后按Enter键将文件保存到其当前位置。
使用键盘组合Ctrl + X退出nano。
CLI解决方案
另一个值得研究的实用工具是exiftool 。 exiftool对pdfinfo的优势在于它支持更多的元数据类型(例如XMP标签)。
这是一个命令的示例,它将打印所有可用的元信息( -a
),按组排序( -G1
):
exiftool -a -G1 "$File"
支持的PDF相关标签的概述:
- PDF标签
- XMP PDF标签
- XMP直流标签
您可以在Ubuntu上安装exiftool:
sudo apt-get install libimage-exiftool-perl
GUI解决方案
如果您正在寻找GUI PDF元数据查看器/编辑器,您可以试试PDFMtEd 。 这是我用exiftool管理PDF元数据的一组图形工具:
“最佳”的答案实际上取决于您想要多少细节以及您希望观看者的稳定程度。 在linux中存在许多用于查看甚至编辑后脚本和pdf文件的软件; 所有这些似乎已从当前的Ubuntu存储库中删除(可能是由于稳定性问题)。
现在我建议尝试pdfedit。 如果您使用的是Quantal或更早版本,可以通过它安装
sudo apt-get install pdfedit
对于较新的版本,您需要从它的项目页面下载它,解压缩并自行编译。
详细说明pdftk
编辑方法,这很好,因为它向您展示了所有正在设置的内容,同时允许您更改任何您喜欢的内容,这里有一个脚本(对于您的.bashrc
或其他别名文件)来执行此操作用一个命令。 这将创建要编辑的文件的新版本,使用元数据文件打开您喜欢的编辑器,然后实现更改并将修改后的PDF文件上的文件创建/修改时间设置为与原始文件相同。 要使用它,在为.bashrc
文件提供资源后,只需输入即可
editPDFmetadata myfile.pdf
这是别名:
editPDFmetadata() { OUTPUT="${1}-new.pdf" METADATA="tmp${1}-report.txt" pdftk ${1} dump_data output $METADATA $EDITOR $METADATA pdftk ${1} update_info $METADATA output $OUTPUT touch -r ${1} ${OUTPUT} }
只需将上面的定义放入主文件夹中的.bashrc
文件中,然后打开一个新终端即可使用。