哪个是Ubuntu最好的PDF元数据查看器?

关于Ubuntu提供的最佳PDF查看器,有很多问题和答案。 但我想解析PDF文件并了解PDF的详细信息,例如给定PDF文件中可用的图像,字体和链接。

是否有可用的PDF元数据查看器?

  1. 查看名为Example.pdf的文件的pdf元数据:

    pdfinfo Example.pdf 
  2. 使用nano编辑器编辑终端中的现有元数据:

     pdftk Example.pdf dump_data output Metadata-output.txt nano Metadata-output.txt 
  3. 更新元数据:

     pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf 

Nano编辑器键盘快捷键
使用键盘组合Ctrl + O ,然后按Enter键将文件保存到其当前位置。
使用键盘组合Ctrl + X退出nano。

CLI解决方案

另一个值得研究的实用工具是exiftool 。 exiftool对pdfinfo的优势在于它支持更多的元数据类型(例如XMP标签)。

这是一个命令的示例,它将打印所有可用的元信息( -a ),按组排序( -G1 ):

 exiftool -a -G1 "$File" 

支持的PDF相关标签的概述:

  • PDF标签
  • XMP PDF标签
  • XMP直流标签

您可以在Ubuntu上安装exiftool:

 sudo apt-get install libimage-exiftool-perl 

GUI解决方案

如果您正在寻找GUI PDF元数据查看器/编辑器,您可以试试PDFMtEd 。 这是我用exiftool管理PDF元数据的一组图形工具:

在此处输入图像描述

在此处输入图像描述

“最佳”的答案实际上取决于您想要多少细节以及您希望观看者的稳定程度。 在linux中存在许多用于查看甚至编辑后脚本和pdf文件的软件; 所有这些似乎已从当前的Ubuntu存储库中删除(可能是由于稳定性问题)。

现在我建议尝试pdfedit。 如果您使用的是Quantal或更早版本,可以通过它安装

 sudo apt-get install pdfedit 

对于较新的版本,您需要从它的项目页面下载它,解压缩并自行编译。

详细说明pdftk编辑方法,这很好,因为它向您展示了所有正在设置的内容,同时允许您更改任何您喜欢的内容,这里有一个脚本(对于您的.bashrc或其他别名文件)来执行此操作用一个命令。 这将创建要编辑的文件的新版本,使用元数据文件打开您喜欢的编辑器,然后实现更改并将修改后的PDF文件上的文件创建/修改时间设置为与原始文件相同。 要使用它,在为.bashrc文件提供资源后,只需输入即可

editPDFmetadata myfile.pdf

这是别名:

 editPDFmetadata() { OUTPUT="${1}-new.pdf" METADATA="tmp${1}-report.txt" pdftk ${1} dump_data output $METADATA $EDITOR $METADATA pdftk ${1} update_info $METADATA output $OUTPUT touch -r ${1} ${OUTPUT} } 

只需将上面的定义放入主文件夹中的.bashrc文件中,然后打开一个新终端即可使用。