如何解码带有 \uXXXX 等符号的文本文件?

如何解码带有 \uXXXX 等符号的文本文件?

我有一个包含字符的 10 Mb 文件\uXXXX。如何使用 Sublime Text 对其进行解码?

例子:
在此处输入图片描述

答案1

您可以尝试几种不同的方法。首先,您需要使用支持要显示的字符的 Unicode 字体。本网站unicode.org 是一个很好的资源,Google 也一如既往地非常有帮助。如果您不介意使用非等宽字体,Windows 附带的 Arial Unicode MS 具有相当好的覆盖率。我相信等宽字体 Consolas 也一样。

其次,您的操作系统需要设置为显示这些字符 - 大多数现代操作系统都是如此,但您可能会遇到某些 Windows 版本和设置的问题。

在 Sublime 中,确保你以正确的模式查看文件 - 尝试File -> Reopen with Encoding -> UTF-8或者... -> UTF-16LE(或者BE,您可以两者同时尝试)。

因此,在不知道文件的具体内容、生成方式以及系统详细信息的情况下,我只能尽力而为。祝你好运!


编辑

根据您链接的文件,这看起来像是 Python 2 程序的输出,因为数据似乎是一些包含 unicode 字符串的列表(碰巧我是一名 Python 程序员)。我查了一下提到的几个代码点,它们都是西里尔文,所以几乎任何现代字体都应该可以处理它们。问题是您需要一个程序来读取文件并翻译各个字节。如果您感兴趣的话,第一个完整字符串(从'')是:

超级推荐!在节目中我们遇到了“3 个人从 1 中心”!晚上 9 点到 12 点!超过 4 天了!联系方式:evrasia.spb.ru,电话:88005050145 和 008

如果没有整个文件,我无法为您解析整个文件,但如果您是 Python 程序员,您应该知道该怎么做(我建议使用 Python 3,它的 Unicode 支持比 2.x 好得多)。如果没有,请找到生成该文件的人并让他们为您解码字节。

相关内容