混合编码

混合编码

对于混合了不同编码的文本,有没有办法找到所有编码?并将它们转换为单一编码,例如 utf8?

我从不同的来源(可能具有不同的编码)复制到 gedit 下的文本文件中。令人惊讶的是,我很少需要考虑编码混合问题。想知道为什么?

但是当我在emacs下打开这样的文件时,似乎我不得不面对这个问题。

如果我通过从不同来源复制到emacs中创建一个文本文件,然后在gedit下打开该文本文件,会是一样的吗?也就是说,在 emacs 中可以,但在 gedit 中不行吗?

答案1

这是不可能的,因为有效范围不同编码的数据确实重叠,因此无法明确确定哪一块文本具有哪种编码。

你可能不喜欢这个答案,但在我看来,这些都是事实。

相关内容