Emacs 显示 UTF-8 文件中某些字符的八进制转义

Emacs 显示 UTF-8 文件中某些字符的八进制转义

我使用网站(例如 math.stackexchange.com、wikipedia 等)的 gedit 默认设置将一些数学公式复制到 gedit 下的一些文件中。

当我现在在 emacs 下打开文件时,编码不正确。

文件最可能的编码是什么?

例如,以下是 emacs 中 utf-8 下显示的一些文本:

Let f be a measurable function from (\246\270,F,\246\314) to (R,B(R)).                                                                 
then                                                                                                                                   
\246\314(|f|>t) as a function of t is Riemann integrable over [0,\241\336).                                                            
the expectation of the measure f induces on its codomain i.e. \241\322_\246\270 |f| d\246\314 = \241\322_[0,\241\336) \246\314(|f|>t) 

实际上在 gedit 中显示为:

Let f be a measurable function from (Ω,F,μ) to (R,B(R)). 
then
μ(|f|>t) as a function of t is Riemann integrable over [0,∞).
the expectation of the measure f induces on its codomain i.e. ∫_Ω |f| dμ = ∫_[0,∞) μ(|f|>t) 

如何找出示例文本的编码字符集?谢谢。

答案1

如何找出示例文本的编码字符集?

如果您的意思是如何在 emacs 中打开示例文本时找到字符集,那么也许M-x describe-current-coding-system在 emacs 中就是您所追求的?

答案2

如果您需要找出特定文件的编码,可以使用以下file命令:

$ cat findenc.txt 
Let f be a measurable function from (Ω,F,μ) to (R,B(R)). 
then
μ(|f|>t) as a function of t is Riemann integrable over [0,∞).
the expectation of the measure f induces on its codomain i.e. ∫_Ω |f| dμ = ∫_[0,∞) μ(|f|>t)
$ file findenc.txt 
findenc.txt: UTF-8 Unicode text
$ 

我不确定您使用的 emacs 版本是什么,但该文件在 emacs24 和 emacs23 以及 gedit 和 vi 中自动看起来对我来说是正确的,而无需更改任何设置(Ubuntu 14.04)。

相关内容