我用 Google 搜索了这个主题,但没有找到我想要的东西......以下事情“发生”在我身上:
我把文件存储在 NTFS-USB 硬盘上,由于空间问题,我将它们移动到了 ext3 系统....不知何故文件名(据我所见内容仍然正常)编码搞砸了....我的文件现在如下所示:
Kküken <--- should have an "ü"
Jäger <--- should be an "ä"
Zwölf <--- should be an "ö"
fünfte <-- should be an "ü"
etc ....
这些只是例子,但已经给了我第一个问题,为什么“ü”有两种不同的表示?(也许我搞砸了,在我搞砸之前,现在我混合了 x 个不同的编码层?:))
我尝试了以下命令:
convmv -r -f UTF-8 -t ISO-8859-1 *
此命令对某些文件有效(例如Zwölf
),但不适用于所有文件:
iso-8859-1 doesn't cover all needed characters for: "fünfte"
所以我猜想这肯定是另一种编码 - 但具体是哪种呢?我怎样才能找出答案呢?
有什么方法可以解决所有这些问题吗?
答案1
我将这 4 行复制并粘贴到一个文本文件中,然后在 Firefox 中打开它。浏览器自动检测它是 UTF-8 并显示以下内容
Kküken <--- should have an "�"
Jäger <--- should be an "�"
Zwölf <--- should be an "�"
fünfte <-- should be an "�"
您的原始副本没有“搞砸”,它正确地拾取了 NTFS unicode 文件名。相反,您的显示器/tty/字体似乎不支持 UTF8/unicode 输出。
也许尝试在 X windows 环境中查看你的副本。