我正在研究如何利用机器翻译教计算机从页面描述语言 (PDL)(如 PostScript 和 PDF)生成 LaTeX 代码。
为了实现这一点,拥有一个对齐的 LaTeX<->PDL 句子的语料库将非常有用。
我已经查看了 LuaTeX 源代码一段时间,寻找将 TeX 标记列表转换为 DVI 输出的位置。我希望可以修改源代码以在此处转储标记列表和生成的 DVI,这将产生对齐的 TeX<->DVI 语料库。我无论如何也想不出这应该放在哪里,甚至不知道 TeX 标记是否以允许将其与 DVI 输出对齐的方式转储。
tl;dr:LuaTeX 在哪里执行 TeX 标记列表到 DVI 的实际转换,是否可以将这些标记列表与生成的 DVI 代码关联起来?