关于 Ubuntu 上最好的 PDF 查看器有很多问题和答案,但我想解析 PDF 文件并了解 PDF 的详细信息,例如给定 PDF 文件中可用的图像、字体和链接。
是否有可用的 PDF 元数据查看器/标签编辑器?
答案1
查看名为 Example.pdf 的文件的 pdf 元数据:
pdfinfo Example.pdf
使用 nano 编辑器编辑终端中的现有元数据:
pdftk Example.pdf dump_data output Metadata-output.txt nano Metadata-output.txt
更新元数据:
pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
Nano 编辑器键盘快捷键
使用键盘组合键Ctrl+O然后按 将Enter文件保存到当前位置。
使用键盘组合键Ctrl+X退出 nano。
答案2
CLI 解决方案
另一个值得研究的实用程序是外置工具。exiftool 相对于 pdfinfo 的优势在于它支持更多元数据类型(例如 XMP 标签)。
下面是一个命令示例,它将打印所有可用的元信息 ( -a
),并按组排序 ( -G1
):
exiftool -a -G1 "$File"
支持的 PDF 相关标签概述:
您可以使用以下命令在 Ubuntu 上安装 exiftool:
sudo apt-get install libimage-exiftool-perl
GUI 解决方案
如果你正在寻找 GUI PDF 元数据查看器/编辑器,你可以PDF版试试吧。这是我编写的一组图形实用程序,用于使用 exiftool 管理 PDF 元数据:
答案3
“最佳”的答案实际上取决于您想要多少细节以及您希望查看器有多稳定。 Linux 中有许多用于查看甚至编辑 post script 和 pdf 文件的软件;所有这些软件似乎都已从当前的 Ubuntu 存储库中删除(可能是由于稳定性问题)。
目前我建议尝试 pdfedit。如果你正在使用 Quantal 或更早版本,可以通过以下方式安装
sudo apt-get install pdfedit
对于较新的版本,你需要从以下位置下载这是项目页面,解压并自行编译。
答案4
sudo apt-get install libimage-exiftool-perl
可以通过以下命令彻底删除元数据
exiftool -all:all= file_name