即使以正确的编码格式打开文件也会出现问号

即使以正确的编码格式打开文件也会出现问号

我一直在 StackOverflow 和这里查找,希望找出为什么某些字符会变成问号。更准确地说:通常是诸如éó等字母。

我尝试了多种不同的解决方案,例如将其设置为不同的编码格式,尝试找出使用的格式(UTF-8打开 Visual Studio Code 时的默认格式)以及许多其他解决方案。不幸的是,我无法让字符出现。它们仍然是问号。

我必须注意,该文件是压缩的,我用 解压了它7zip。然后我用 Visual Studio Code 打开了该文件。我无法用记事本打开它,因为文件太大,记事本无法打开。

举个例子:

Michel Tel?: Sunset (2013) (V)  [Themselves]

如果你查找,你会看到它是“Michel Teló”。我需要亲自检查文件,然后才能将其转换为 CSV。有什么方法可以解决这个问题吗?

答案1

要查看实际的字符,以十六进制编辑器,例如免费的HxD 编辑器来自 Maël Hörz (mh-nexus),或者很多选择一个设计良好的十六进制编辑器可以显示几乎所有任何大小,甚至是整个多 TB 的硬盘,只需打开一部分一次读取整个文件。

ë(e-umlaut)的显示方式如下氢键并且免费记事本++编辑:

HxD 中的 e 变音符号

注意是十六进制字节串,0x4D,0x61,但单个字母ë是双字节字符,0xC3,0xAB。

为了正确显示这些字符,

  1. 文本编辑器必须能够正确显示多字节字符,例如记事本++做。
  2. 必须将文本编辑器设置为使用以下字体:包括那些特定的字符,比如谷歌的免费因科索拉塔,用于记事本++上面的截图。

使用 Windows'字符映射表查看字体中包含的内容。

相关内容