Excel 字符编码 - 单元格显示一件事,而文本导出包含新字符

Excel 字符编码 - 单元格显示一件事,而文本导出包含新字符

我在 Excel 365 中遇到了一个有趣的情况。

我有一列是联系人的电话号码。查看单元格后,结果如下所示:

+xxx‎31417728

但是,当我将文件导出为 TAB 分隔的文本文件时,相同的数字变成:

+xxx?31417728

请注意问号,它在单元格中是不可见的。

问题是什么?如何在 Excel 中显示这些隐藏字符?

谢谢。

答案1

Excel 导出具有 Windows-1252/CP-1252 字符编码的文本文件。

https://stackoverflow.com/a/50653812/148844

因此,如果您有一个不适合 Windows-1252 字符集的 UTF-8 字符,那么它将被损坏并导出。

目前还没有已知的方法可以使用 Excel 正确导出文本文件,因为这是一个已知的错误,不支持 UTF,正如您从我链接到的数千个答案中看到的那样。

一些替代的导出方法是复制并粘贴到 Google 表格,然后导出 TSV 或使用 Open Office 读取 Excel 文件并使用 UTF8 导出。

有时 UTF 具有非打印字符来控制变音符号的显示位置,并将其他语言中的单个字母合并为一个。

https://en.wikipedia.org/wiki/Control_character#In_Unicode

相关内容