如何解压日文 ZIP 文件并避免出现乱码

如何解压日文 ZIP 文件并避免出现乱码

我收到了一位日本客户发来的 ZIP 文件。

当我尝试解压缩它时,文件和文件夹名称混乱了:

$ unzip ~/Downloads/【新入荷ECM】資料.zip
...
 inflating: БyРVУ№Й╫ECMБzОСЧ┐/123_ГЖБ[ГXГPБ[ГX.xlsx

这是什么问题?如何避免?

答案1

问题是,日本流通的大多数 ZIP 内容编码作为Shift JIS,在 Ubuntu 上默认情况下无法正确显示。

-O shift-jis解决方案是在命令中使用该选项:

$ unzip -O shift-jis ~/Downloads/【新入荷ECM】資料.zip
...
 inflating: 【新入荷ECM】資料/123_ユースケース.xlsx

这样,扩展的文件在 Ubuntu 中就可以完美读取。

答案2

简单的答案

$ sudo apt install unar
$ unar ~/Downloads/【新入荷ECM】資料.zip

乌纳尔可以自动识别使用的编码。它只进行提取,不进行压缩。

然后使用'康维' 对提取后的文本进行编码。

$ convmv -f shift_jis -t utf8 БyРVУ№Й╫ECMБzОСЧ┐/123_ГЖБ[ГXГPБ[ГX.xlsx --notest

反之亦然,如果您想将文件从 utf8 创建为适用于 Windows 的 shift_jis 文本。

$ convmv -f utf8 -t shift_jis <filename> --notest

备选答案,使用 Ubuntu 日本团队内置的自动编码'解压缩但你必须添加存储库

相关内容