混乱的字符集

混乱的字符集

在我的Linux环境中,对于一些未知!当我处理从中复制的原始未格式化文件时的原因Win7prof(以 utf-16 编码), 生成的文件都是混乱的。它会在 Linux 中打印 OK 使用命令,但如果我,它也像这样混乱:

用户名;全名;群组ï¿哎呀哎呀¸çæçæççæçäæ¸çæçæççæçäæ¡æææçäæ¸çæææ°æâ¸ææ¤æ´ã�桤çæâ´ççæççस^@ææ´´æ¤çä¸æææ¤æäæ¸æææ°æâ¸ææ¤æ´¸æäæ´æ¤çææ´æ¤çä¸æææ¤æäæ¡啊啊啊°æâ¸ææ¤çæâ´ççæççà¸^@ææçæ¼æ¸â¸ææ°æçææ æçäæ¸çæææçææ æçäæ¼çæææ°æâ¸æ検æ´à¸^@ææçæœæ¸â¸ææ°æçææ æçäæ¼çææ°æâ¸噗噗噗噗噗噗噗^@噗噗噗噗噗噗^@噗噗噗噗噗


当移动到 Windows 时,同一个文件打开时会显示前几个单词 英语,然后文件的其余部分以汉字打印!
好像:

用户名;全名;群组*嗾猀攀爀渀愀洀攀㬀䘀甀氀氀一愀洀攀㬀猀琀愀琀甀猀਀愀⸀愀洀碗琀⸀猀愀爀愀猀眀愀琀䀀漀爀愀挀氀攀⸀挀漀洀㬀䄀匀愀爀愀猀眀愀琀愀⸀愀洀碗琀⸀猀愀爀愀猀眀愀琀䀀漀爀愀挀氀攀⸀挀漀洀㬀䔀䄀匀开甀猀攀爀猀਀愀⸀愀洀碗琀⸀猀愀爀


当我检查文件的字符集时,它返回:
应用程序/八位字节流
我跑不了图标命令,因为它拒绝八位字节流
作为字符集!

我唯一确定的是,我的 Linux 和 Windows 之间的文件格式一直兼容,我已经在 Linux 上修改了文件,并通过 ftp 永远返回到 Windows,直到现在使用以下命令没有任何问题:

[me@localhost fkhodada]# awk -F';' -v OFS=';' '

{ for (i=3; i<=NF; i++) print $1,$2,$i }
' file1 > 最终

答案1

在玩完这个场景后,我意识到编码问题出在我从 Windows 环境导出的原始文件中。
所以我重复了同样的例程,这一次,在“另存为”参数中,选择编码类型为 UTF8,文件在 Linux 中看起来很好,修改并导出回 Windows 后,在 Windows 记事本中看起来也很好。

相关内容