如何识别文件编码？

Question

安装 Python（例如从 Microsoft Store 安装），然后pip install chardet，您应该有chardetect命令或至少python -m chardet。它将执行统计分析以猜测最可能的字符集。

python -m chardet somefile.txt

一些提示：该文件最初是一个 Eudora mbx 文件，主要包含法语内容。它的历史可以追溯到 1998 年左右，可能来自 MacOS 版本的 Eudora。非 ASCII 编码为单字节：

那么可能不会有单一编码；它可能是几种不同编码的消息的混合。您需要对每条消息分别执行字符集检测。

Answer 1

安装 Python（例如从 Microsoft Store 安装），然后pip install chardet，您应该有chardetect命令或至少python -m chardet。它将执行统计分析以猜测最可能的字符集。

python -m chardet somefile.txt

一些提示：该文件最初是一个 Eudora mbx 文件，主要包含法语内容。它的历史可以追溯到 1998 年左右，可能来自 MacOS 版本的 Eudora。非 ASCII 编码为单字节：

那么可能不会有单一编码；它可能是几种不同编码的消息的混合。您需要对每条消息分别执行字符集检测。

相关内容