解压unicode文件时如何避免语言损坏?

解压unicode文件时如何避免语言损坏?

我经常在解压 zip 文件时看到未知的文件名。

例如,

 ╕╢╣¤└╟╝║-Bb└╠┴╢╛╟▒т┐ы-┼м╢є╕о│▌,┼╫│╩╗Ў╝╥╞∙ ╝╥╟┴╢є│ы╗Ў╝╥╞∙ ,╞о╖│╞ъ

什么可以解决这个问题?

答案1

尝试使用 p7zip。(@Pilot6 提到 p7zip 对于非 UTF-8 编码效果不佳,但如果您只需要 UTF-8,那么这是一个简单的解决方案。)

apt-get update
apt-get install p7zip-full
7z x thefile.zip -o"outputDir"

答案2

韩语 MS Windows 编码 cp-949可用于压缩原始文件。尝试unzip使用 Windows 编码选项。

unzip -O cp-949 <file.zip>

笔记:我查看了原始发帖人的个人资料,知道他/她来自哪里(韩国首尔)。对于其他用户,您必须检查 zip 的来源并分别更改编码。

答案3

如果您使用标准 Ubuntu Archive Manager 和 Ubuntu 14.04+ 版本,则可以通过安装修补的 Archive Manager(file-roller)来解决此问题。问题是,如果安装了 p7zip-full,file-roller 会使用 p7zip 来解压 zip 档案。但 p7zip 不能很好地处理非 UTF-8 编码。我修补了 file-roller,使其始终使用 unzip 来实现此目的。Unzip 本身已修复。修补的 file-roller 可以从我的 ppa 安装

sudo add-apt-repository ppa:hanipouspilot/file-roller
sudo apt-get update
sudo apt-get install file-roller

答案4

我通过两种方式取得了成功:

unzip -O cp936 file.zip
unzip -O GBK file.zip

相关内容