访问特定信件的元数据

访问特定信件的元数据
  • 是否有任何字体类型存储有关每个字母的元数据?
  • 或者 Unicode 是否提供了有关每个符号的任何语言信息?
  • 可以在 XeTeX 中访问这些元数据吗?

答案1

我唯一知道的是:

  • 用于\fontdimen获取字体的尺寸。请参阅TeX 按主题分类4.3 字体信息。

  • 用于\XeTeXglyphbounds获取每个字形的边界框。请参阅XeTeX 参考

  • 用于\the\XeTeXcharclass ...获取字形的预定义字符类。您可以区分 CJK 字符(类 1)、CJK 标点符号(类 2 和 3)和普通字符(类 0)。这就是 XeTeX 所知道的全部。例如,

    \the\XeTeXcharclass`a    % 0
    \the\XeTeXcharclass`文   % 1
    \the\XeTeXcharclass`《   % 2, should not be at the end of a line
    \the\XeTeXcharclass`。   % 3, should not be at the beginning of a line
    

我不认为每个符号都包含语言信息。

相关内容