为什么pdflatex生成的PDF文件无法通过验证？

Question 1

PDFBox 的预检工具不仅仅针对 PDF，还针对 PDF/A-1b 标准进行验证。

关于 PDF/A-1b 的第一个错误应该可以通过最新的 pdfTeX 解决，我在使用 pdfTeX 1.40.16（TeX Live）时没有遇到这些错误。

关于元数据的最后一个错误 7.1 来自 PDF/A-1b 的要求，即在 XMP 格式中嵌入元数据，请参阅包hyperxmp，最新版本的软件包pdfx支持 PDF/A，或封装xmpincl。

Answer

PDFBox 的预检工具不仅仅针对 PDF，还针对 PDF/A-1b 标准进行验证。

关于 PDF/A-1b 的第一个错误应该可以通过最新的 pdfTeX 解决，我在使用 pdfTeX 1.40.16（TeX Live）时没有遇到这些错误。

关于元数据的最后一个错误 7.1 来自 PDF/A-1b 的要求，即在 XMP 格式中嵌入元数据，请参阅包hyperxmp，最新版本的软件包pdfx支持 PDF/A，或封装xmpincl。

Question 2

这PDF/A标准旨在优化档案。这意味着必须嵌入字体（自动完成），它需要元数据，以便您在档案中找到文档。最后但并非最不重要的是，它需要一个 OutputIntent 来指定颜色最初的样子。还有更多要求，但这些是最重要的。

尽管 PDFBox 1.8 没有抱怨缺少 OutputIntent，但它的较新版本会抱怨。

看到这个最小示例 PDF/A 文档关于如何直接从 pdfTeX 生成 PDF/A。这验证了：

java -jar preflight-app-2.0.19.jar hyperxmp.pdf
The file hyperxmp.pdf is a valid PDF/A-1b file

(pdf)TeX 无法猜测您打算使用哪种颜色空间，也无法猜测特定文档的有用元数据是什么。这就是为什么您必须指定这些值。请记住，验证器只是检查在场某些值。例如，如果你将作者设置为“我”或空的即使您的文档通过了自动验证，人们也很可能无法在图书馆中找到您的文档。

Answer

这PDF/A标准旨在优化档案。这意味着必须嵌入字体（自动完成），它需要元数据，以便您在档案中找到文档。最后但并非最不重要的是，它需要一个 OutputIntent 来指定颜色最初的样子。还有更多要求，但这些是最重要的。

尽管 PDFBox 1.8 没有抱怨缺少 OutputIntent，但它的较新版本会抱怨。

看到这个最小示例 PDF/A 文档关于如何直接从 pdfTeX 生成 PDF/A。这验证了：

java -jar preflight-app-2.0.19.jar hyperxmp.pdf
The file hyperxmp.pdf is a valid PDF/A-1b file

(pdf)TeX 无法猜测您打算使用哪种颜色空间，也无法猜测特定文档的有用元数据是什么。这就是为什么您必须指定这些值。请记住，验证器只是检查在场某些值。例如，如果你将作者设置为“我”或空的即使您的文档通过了自动验证，人们也很可能无法在图书馆中找到您的文档。

相关内容