由于矢量图像中的连字导致 PDF/A 验证嵌入了 CID 字体子集

由于矢量图像中的连字导致 PDF/A 验证嵌入了 CID 字体子集

目标和工作流程

我想使用 pdfLaTeX 软件包生成符合 PDF/A-2b 标准的 PDF 文档pdfx目标文档包括 PDF 矢量图像,这些图像是从 SVG 源导出的,Inkscape 0.91使用另存为并离开将文本转换为路径未选中。这些矢量图像包含带有连字,例如由字符组合“ff”生成的字符。当然,支持连字的字体,Linux 生物医学在我的例子中,使用的是 TrueType。对于 PDF/A 验证,我使用3-Heights™ PDF 验证器在线工具. 另请参阅示例文件集

问题

导出的 PDF 矢量图像和使用 pdfLaTeX 创建的目标 PDF 文档(包含矢量图像)都会导致以下验证问题:

The key CIDToGIDMap is required but missing.

如果文本中不使用连字符,PDF 文件仅包含嵌入的子集:

  • 林比奥林类型:TrueType编码:Ansi

使用连字时,PDF 文件包含一个额外的嵌入子集:

  • 林比奥林类型:TrueType(CID)编码:Identity-H

验证问题仅在添加第二个子集时发生,即使用连字会导致 PDF 中包含第二个字体子集,从而导致 PDF/A 验证问题。另一个工具 veraPDF 将其与规则 6.2.11.3-2

问题

如何调整所描述的工作流程以使用包括带连字符的文本在内的 SVG 图像,同时保持 PDF/A 兼容性?

答案1

到目前为止,我还没有发现基于 TeX 的软件可以创建或以其他方式处理CIDToGIDMap流。它们对于 CJK 字体尤其重要,就像在使用 XeLaTeX 生成的文档中所使用的那样。这是阻止使用 XeLaTeX 生成符合 PDF/A 标准的 CJK 文档的最后几个障碍之一。

我想要将适当的支持融入其中pdfx.sty,因此我正在寻找示例来帮助开发。您能否给我发送一个小型示例文档,以显示非 CJK 设置中的问题?([电子邮件保护]

相关内容