如何使用 CRLF 行终止符更改 ISO-8859 文本

如何使用 CRLF 行终止符更改 ISO-8859 文本

我正在尝试将文本文件的编码更改为 UTF-8。

我是 Unix 新手,所以任何帮助都会很棒。我不确定如何使用重新编码功能正确编码。

答案1

最直接的可能是使用图标

手册中建议的方式 ( iconv -f ISO88592 -t UTF8 < input.txt > output.txt) 可能不适用于 ISO-8859 作为参数,因为可能需要规范的子部分 (-1…-9…-14…),但是… iconv 应该能够自动识别编码源文件的。所以......只需尝试:

iconv -t UTF-8 yourfilename

此外,正如明智的建议马库斯,如果还愿意将类似 dos 的行结尾转换为 *nix 标准(CR-LF -> LF),您可以使用dos2unix。请注意,根据您的发行版,您可能需要安装一些额外的软件包。如果这会导致问题,您还可以使用更多标准工具来删除 CR :

使用 tr :tr -d '\r' < yourfilename_withCRLF > yourfilename_LFonly

使用 sed :sed -i 's/\r$//g' youfilename_withCRLF

相关内容