捷克符号变成了乱码

捷克符号变成了乱码

我在使用 Windows 10 家庭版时遇到了一个奇怪的问题。当我打开一些基本文本文件时,.srt.txt有不同的编码。我猜这是因为编码不同,因为我是捷克人,所以我需要捷克符号:

ě,š,č,ř,ť,ž,ň等等,

这意味着 Unicode、Windows-1250 或 ISO Latin 2。

我尝试更改操作系统语言 - 没有用。
在 Chrome 中查看选项也没用 - 浏览时我没有遇到任何问题。使用 IE、Opera 或 Firefox 下载文本文件也会出现同样的结果。
我正在从专门提供电影和连续剧字幕的网站手动下载它们。

  • 当我在不同的计算机上下载文本文件时,捷克符号很好。
  • 通过邮件、Facebook 发送下载的文件
  • 或者通过闪存盘传输时,捷克符号变成了乱码。
    例如,“ě”在文件中被保存为“?”,“č”被保存为“è”,等等。甚至当我打开压缩文本文件时,它也被改变了。

答案1

与早期的 Windows 版本不同,Windows 10 没有提供太多的语言支持。

您需要从语言控制面板中单独获取所需的语言包。

https://support.microsoft.com/help/14236/language-packs了解每种语言源的详细信息。

答案2

如果它显示错误的字符,那么它不是 UTF-8 但被解释为 UTF-8,或者它是 UTF-8 但未将其显示为 uni-code。

如果您使用 UTF-8 编码,Unicode 会为所有字符分配一个唯一的代码点,而这会导致代码点出现,而我没有该代码点的字形,那么我的 Windows 10 就会显示此字形缺失字形 如果代码点无效,则我的 Windows 10 将显示未知

由于您得到的是错误字符(而不是未知字符),我认为编码没有得到正确解释。因此我认为确保所有文件都是 UTF-8,并且两台机器都将文件视为 UTF-8。

UTF-8 是 Unicode 的一种编码,但是 Windows-1250 或 ISO Latin 2 是将相同字节序列解释为不同字符的代码页。

相关内容