如何防止使用 tex4ht 转换为 ODT 时丢失希腊文 Unicode 字符

如何防止使用 tex4ht 转换为 ODT 时丢失希腊文 Unicode 字符

要从 XeLaTeX 源转换为.odt/ .docx,我使用Michal Hoftich 提供的解决方案(请参阅 MWE 和@michal.h21 的解决方案。)

该设置非常适合转换 Unicode,但我注意到它会吞噬希腊 Unicode 字符 ἀ。也就是说,在源中输出的内容为空。

有没有简单的方法可以修复该错误?

答案1

这是由用于注册 Unicode 范围的代码中的错误引起的tex4ht。它跳过了范围内的第一个字符,而这个字符恰好是,其 Unicode 值为0x1F00。我已经在tex4ht源代码中修复了这个问题,但可能需要几天时间才能在 TL 中安装更新。在此期间,您可以在自定义配置文件中使用单个字符的声明:

\xeuniregisterchar{"1F00}

此代码使字符变为活动状态。然后它可以tex4ht用 Unicode 值输出特殊代码。

示例文件:

在此处输入图片描述

相关内容