获取文档中所有 wordperfect 重写字符以转换为 unicode

获取文档中所有 wordperfect 重写字符以转换为 unicode

我正在将用 wordperfect 5 编写的字典转换为纯文本。理想情况下,我会得到一个 UTF-8 文件,每个条目占一行,字段用制表符分隔,但我离题了。

我遇到的问题是,字典中包含许多非 ASCII 字符,这些字符由(可能多个)重打组成,其中一些包含重打字符的格式(?)。有没有办法获取文档中使用的重打字符及其组成字符的完整列表?除非我错了,否则这是通过脚本或其他转换工具将重打字符转换为 unicode 的必要先决条件。

相关内容