tty1 中无法读取的菱形字符

Question

图形用户界面开启tty7使用 X 字体，同时tty1使用 Linux 控制台字体（限制为 512 种不同的字形）。 Linux 控制台显示那些菱形（取决于字体），其中 Unicode替换字符会显示，因为它尝试显示的代码不是合法的 UTF-8。

您会得到 ISO-8859-1 等的这种行为。您可能还记得 ISO-8859-1 代码0xa0到0xff映射到 Unicode0x00a0到0x00ff。但在 UTF-8 中，字节看起来不同。

“键入”文件（可能使用cat）不受区域设置的影响。这编码的数据和模式终端的（UTF-8与否）决定字符是否正常打印。

一个有趣的（错误的）特征rxvt-unicode是它注意到非 UTF-8 数据，并假设它是 ISO-8859-1 并（默默地）将其转换为 Unicode。波兰语为 ISO-8859-2，看起来基本相同

如果您碰巧使用 rxvt-unicode 并检查非 UTF8 波兰语文本，那就可以解释问题中的所有症状。

该file实用程序可以合理猜测文本是否为 UTF-8。

在澄清之后，这里有一些屏幕截图来展示您的内容能从 Linux 控制台中的默认字体获取。这使用了恩诅咒测试程序，显示更多/更少的代码 0-255：

首先，UTF-8模式下的Latin-1字符：

然后是 Latin-1 字符没有UTF-8 模式：

并使用UTF-8模式，但运行luit使用 ISO8859-2 编码，并使用相同的测试程序pl_PL（有点迂回，但你可以比较）：

并将其与xterm：

总之，您可能会注意到一些含片拉丁语1在 Linux 控制台中使用 UTF-8 模式的有限字体的字符集。但波兰语（一种不同的字符集）似乎已得到很好的覆盖。

Answer 1