当从浏览器(我尝试了 Firefox 和 IE)复制 UTF-8 编码的连字符 (U+2010) 然后粘贴到 Putty 和 Vim(Windows 版本)等程序时,所有连字符都显示为“未知字形”。粘贴到记事本中可以完美运行。在 Debian/wheezy 中复制/粘贴相同的 HTML 文本(从 iceweasel 复制,粘贴到 vim)也可以按预期运行。
但 utf-8 字符没有被破坏。将破坏的文本保存到磁盘或复制粘贴均按预期工作。
我真正要解决的问题是 Confluence 及其导出到 docx 文件的功能。HTML 显示正常,docx 显示未签名的字形,从 docx 复制到记事本时会显示粘贴文本中的连字符。
我该怎么做才能解决这个问题?
答案1
我进一步调查并找到了一个解释:大多数字体中都不包含连字符 U+2010,尤其是 Vim 和 PuTTY 等程序通常需要的固定字体中也不包含。
因此,我的 Confluence 问题的解决方案是:将 Confluence wiki 的内容转换为 MS Word 文件格式时,选择“Arial Unicode MS Standard”作为默认字体。