我正在尝试将文本文件的编码更改为 UTF-8。
我是 Unix 新手,所以任何帮助都会很棒。我不确定如何使用重新编码功能正确编码。
答案1
最直接的可能是使用图标
手册中建议的方式 ( iconv -f ISO88592 -t UTF8 < input.txt > output.txt
) 可能不适用于 ISO-8859 作为参数,因为可能需要规范的子部分 (-1…-9…-14…),但是… iconv 应该能够自动识别编码源文件的。所以......只需尝试:
iconv -t UTF-8 yourfilename
此外,正如明智的建议马库斯,如果还愿意将类似 dos 的行结尾转换为 *nix 标准(CR-LF -> LF),您可以使用dos2unix
。请注意,根据您的发行版,您可能需要安装一些额外的软件包。如果这会导致问题,您还可以使用更多标准工具来删除 CR :
使用 tr :tr -d '\r' < yourfilename_withCRLF > yourfilename_LFonly
使用 sed :sed -i 's/\r$//g' youfilename_withCRLF