more、cat 和 less 支持的字符编码

Question 1

您的 shell 可以显示重音符号等，因为它可能使用 UTF-8。由于有问题的文件是不同的编码，less more并且cat尝试将其读取为 UTF 并失败。您可以使用以下命令检查当前的编码

echo $LANG

您有两种选择，可以更改默认编码，或将文件更改为 UTF-8。要更改编码，请打开终端并输入

export LANG="fr_FR.ISO-8859"

例如：

$ echo $LANG 
en_US.UTF-8
$ cat foo.txt 
J'ai mal � la t�te, c'est chiant!
$ export LANG="fr_FR.ISO-8859"
$ xterm <-- open a new terminal 
$ cat foo.txt 
J'ai mal à la tête, c'est chiant!

如果您正在使用gnome-terminal或类似的，您可能需要激活编码，例如terminator右键单击并：

在此输入图像描述

为了gnome-terminal：

在此输入图像描述

您的另一个（更好）选择是更改文件的编码：

$ cat foo.txt 
J'ai mal � la t�te, c'est chiant!
$ iconv -f ISO-8859-1 -t UTF-8  foo.txt > bar.txt
$ cat bar.txt 
J'ai mal à la tête, c'est chiant!

Answer

您的 shell 可以显示重音符号等，因为它可能使用 UTF-8。由于有问题的文件是不同的编码，less more并且cat尝试将其读取为 UTF 并失败。您可以使用以下命令检查当前的编码

echo $LANG

您有两种选择，可以更改默认编码，或将文件更改为 UTF-8。要更改编码，请打开终端并输入

export LANG="fr_FR.ISO-8859"

例如：

$ echo $LANG 
en_US.UTF-8
$ cat foo.txt 
J'ai mal � la t�te, c'est chiant!
$ export LANG="fr_FR.ISO-8859"
$ xterm <-- open a new terminal 
$ cat foo.txt 
J'ai mal à la tête, c'est chiant!

如果您正在使用gnome-terminal或类似的，您可能需要激活编码，例如terminator右键单击并：

在此输入图像描述

为了gnome-terminal：

在此输入图像描述

您的另一个（更好）选择是更改文件的编码：

$ cat foo.txt 
J'ai mal � la t�te, c'est chiant!
$ iconv -f ISO-8859-1 -t UTF-8  foo.txt > bar.txt
$ cat bar.txt 
J'ai mal à la tête, c'est chiant!

Question 2

ISO-8858 字符编码对于 Linux 系统来说有点过时了。您的整个 Linux 系统可能一直使用 UTF-8。包括您的终端模拟器和 shell。

然而。cat，grep并且less不做任何编码转换，他们会将你的 ISO-8859/latin1 文件视为 UTF-8，这是行不通的。

如果 emacs 能够显示它们，那是因为它尝试自动检测所使用的编码并且显然成功了。告诉 emacs 将文件保存为 UTF-8，然后您就可以在其上使用cat//grep任何内容。

如果您知道确切的字符编码（ISO-8859 是它们的集合，您必须知道确切的编码：ISO-8859-1 或 ISO-8859-15 或更糟），您还可以从命令行转换文件：

iconv --from-code ISO-8859-15 your_file -o your_file_as_utf8

Answer

ISO-8858 字符编码对于 Linux 系统来说有点过时了。您的整个 Linux 系统可能一直使用 UTF-8。包括您的终端模拟器和 shell。

然而。cat，grep并且less不做任何编码转换，他们会将你的 ISO-8859/latin1 文件视为 UTF-8，这是行不通的。

如果 emacs 能够显示它们，那是因为它尝试自动检测所使用的编码并且显然成功了。告诉 emacs 将文件保存为 UTF-8，然后您就可以在其上使用cat//grep任何内容。

如果您知道确切的字符编码（ISO-8859 是它们的集合，您必须知道确切的编码：ISO-8859-1 或 ISO-8859-15 或更糟），您还可以从命令行转换文件：

iconv --from-code ISO-8859-15 your_file -o your_file_as_utf8

Question 3

Cat、More 和 Less 只是执行显示文件的工作。编码之间的转换并不在他们的工作描述中。换行符的编码不是问题，因为 CRLF 的显示方式与普通行结尾 LF 一样，但您的终端可能需要 UTF-8 编码的文本，这是当今事实上的标准。

卢伊特在支持的编码和 UTF-8 之间进行转换。您可以通过设置LC_CTYPE环境变量或使用选项来告诉 Luit 要翻译哪种编码-encoding。例如，要显示 latin-1（又名 ISO 8859-1）文件：

LC_CTYPE=en_US luit less somefile
luit -encoding ISO8859-1 less somefile

如果文件采用 Luit 不支持的某种外来编码，您可以通过翻译程序将其传输。图标支持多种编码。

iconv -f latin1 somefile
iconv -f latin1 somefile | less

Answer

Cat、More 和 Less 只是执行显示文件的工作。编码之间的转换并不在他们的工作描述中。换行符的编码不是问题，因为 CRLF 的显示方式与普通行结尾 LF 一样，但您的终端可能需要 UTF-8 编码的文本，这是当今事实上的标准。

卢伊特在支持的编码和 UTF-8 之间进行转换。您可以通过设置LC_CTYPE环境变量或使用选项来告诉 Luit 要翻译哪种编码-encoding。例如，要显示 latin-1（又名 ISO 8859-1）文件：

LC_CTYPE=en_US luit less somefile
luit -encoding ISO8859-1 less somefile

如果文件采用 Luit 不支持的某种外来编码，您可以通过翻译程序将其传输。图标支持多种编码。

iconv -f latin1 somefile
iconv -f latin1 somefile | less

more、cat 和 less 支持的字符编码

答案1

答案2

答案3

相关内容