我正在将 latex 转换为 xml。因此,我需要将 latex 实体转换为十六进制值。我想从 latex 实体转换为 html 再转换为十六进制实体,还是可以直接从 latex 转换为十六进制值?有什么方法可以做到这一点吗?
例如: \&
至&
、{\'o}
至 ó
我只需要转换符号和特殊字符。
答案1
任何现有的 tex-to-html 或 tex-to-xml 转换器都已经可以执行此操作,但如果您正在编写自己的代码,那么获取所需替换表的最简单的地方就是在 utf8 选项使用的文件中inputenc
,该文件执行相同的工作。
utf8enc.dfu
将位于您的发行版中的同一目录中article.cls
,latex.ltx
以及其余的基础 latex 文件。
它有很多这样的台词
\DeclareUnicodeCharacter{00EB}{\"e}
它告诉你\"e
(和\"{e}
) 需要转换为 U+00eb 或数字引用,因此ë
你只需要将上述内容转换为正则表达式替换,例如
s/\\"\{?e\}?/ë/g
并将其应用到您的文档。