Ubuntu 的 PDF 元数据查看器/标签编辑器

Ubuntu 的 PDF 元数据查看器/标签编辑器

关于 Ubuntu 上最好的 PDF 查看器有很多问题和答案,但我想解析 PDF 文件并了解 PDF 的详细信息,例如给定 PDF 文件中可用的图像、字体和链接。

是否有可用的 PDF 元数据查看器/标签编辑器?

答案1

  1. 查看名为 Example.pdf 的文件的 pdf 元数据:

    pdfinfo Example.pdf  
    
  2. 使用 nano 编辑器编辑终端中的现有元数据:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. 更新元数据:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    

Nano 编辑器键盘快捷键
使用键盘组合键Ctrl+O然后按 将Enter文件保存到当前位置。
使用键盘组合键Ctrl+X退出 nano。

答案2

CLI 解决方案

另一个值得研究的实用程序是外置工具。exiftool 相对于 pdfinfo 的优势在于它支持更多元数据类型(例如 XMP 标签)。

下面是一个命令示例,它将打印所有可用的元信息 ( -a),并按组排序 ( -G1):

exiftool -a -G1 "$File"

支持的 PDF 相关标签概述:

您可以使用以下命令在 Ubuntu 上安装 exiftool:

sudo apt-get install libimage-exiftool-perl

GUI 解决方案

如果你正在寻找 GUI PDF 元数据查看器/编辑器,你可以PDF版试试吧。这是我编写的一组图形实用程序,用于使用 exiftool 管理 PDF 元数据:

在此处输入图片描述

在此处输入图片描述

答案3

“最佳”的答案实际上取决于您想要多少细节以及您希望查看器有多稳定。 Linux 中有许多用于查看甚至编辑 post script 和 pdf 文件的软件;所有这些软件似乎都已从当前的 Ubuntu 存储库中删除(可能是由于稳定性问题)。

目前我建议尝试 pdfedit。如果你正在使用 Quantal 或更早版本,可以通过以下方式安装

sudo apt-get install pdfedit

对于较新的版本,你需要从以下位置下载这是项目页面,解压并自行编译。

答案4

sudo apt-get install libimage-exiftool-perl

可以通过以下命令彻底删除元数据

exiftool -all:all= file_name

相关内容