查找包含奇怪字符的文本文件的编码

查找包含奇怪字符的文本文件的编码

我最近收到一个文件,来自土耳其语,文件中有一些我可以轻松阅读的英文单词和一些奇怪的字符。我想知道这个文件是否经过编码、加密或其他什么。我怀疑它没有加密,因为英文单词很容易被阅读。我尝试使用 vim 的 open with encoding 命令以不同的编码打开文件,并尝试了 utf8、utf16 和其他一些编码,但都无济于事。文件的一部分看起来像这样(使用 Mac 打开TextEdit

在此处输入图片描述

答案1

这很可能不是一个文本文件,因此没有文本编辑器可以正确显示它。

您需要一个查看其文件类型的程序。如果文件名包含后缀,请搜索该后缀的含义,并可能找到文件类型。

答案2

正如其他人提到的,这可能是某种二进制文件。它可能是旧式编码的文本文件,但可能性不大。

无论如何,您可以尝试通过对文件运行命令来查找有关文件的更多信息file,该命令会查看文件以了解其类型。它将查找几种不同的常见文本编码,以及各种常见和不常见的二进制文件类型。

如果您想尝试一些不常见的文本编码,您可以使用iconv -t UTF-8带有各种-f标志的命令来尝试查看编码是否有意义。 iconv -l将列出可用的各种编码,您可能希望查阅 IANA 字符集注册表以查找土耳其语或支持土耳其语的字符集。

如果您认为它是二进制的,您可以通过命令运行文件来了解更多信息strings,该命令会查找可打印的 ASCII 字符串。

相关内容