这是什么角色？

Question

找出答案的最可靠方法是将文件加载到十六进制编辑器（二进制编辑器）中，或者使用hd或hexdump -C或之类的工具xxd来查看这些字符的字节值。

虽然您的屏幕截图显示基于 GTK 的文本编辑器告诉您字符是 U+0002 和 U+0003 - 这些是编辑器处理的“解码”Unicode 代码点，而不是文件中的“原始”字节，但您仍然可以在 codepoints.net 等网站上查找它们，该网站显示：

代码点编号	Unicode 名称	UTF-8 字节表示
U+0002	正文开头	0x02
U+0003	正文结束	0x03

所有 U+007F 以下的 Unicode 代码点都与 ASCII 表中的位置 1:1 对应，并且它们的 UTF-8 表示形式也与 ASCII 中的表示形式相同。

所以他们“不是”C0控制代码范围 – 它们没有标准的视觉表示，因为它们的目的是在机器可读文件中充当分隔符，而不是在人类可读文本中充当分隔符。有些程序可能会将它们显示为“STX”和“ETX”（根据它们的 ASCII 名称）或“^B”和“^C”（因为它们也对应于终端中的 Ctrl 键）；有些程序可能根本不显示它们。

Windows 控制台源自 MS-DOS，它以在IBM PC 代码页– 当字节 0x02 和 0x03 直接放入视频 RAM 时，PC 将显示☻相应♥的内容。

Answer 1

找出答案的最可靠方法是将文件加载到十六进制编辑器（二进制编辑器）中，或者使用hd或hexdump -C或之类的工具xxd来查看这些字符的字节值。

虽然您的屏幕截图显示基于 GTK 的文本编辑器告诉您字符是 U+0002 和 U+0003 - 这些是编辑器处理的“解码”Unicode 代码点，而不是文件中的“原始”字节，但您仍然可以在 codepoints.net 等网站上查找它们，该网站显示：

代码点编号	Unicode 名称	UTF-8 字节表示
U+0002	正文开头	0x02
U+0003	正文结束	0x03

所有 U+007F 以下的 Unicode 代码点都与 ASCII 表中的位置 1:1 对应，并且它们的 UTF-8 表示形式也与 ASCII 中的表示形式相同。

所以他们“不是”C0控制代码范围 – 它们没有标准的视觉表示，因为它们的目的是在机器可读文件中充当分隔符，而不是在人类可读文本中充当分隔符。有些程序可能会将它们显示为“STX”和“ETX”（根据它们的 ASCII 名称）或“^B”和“^C”（因为它们也对应于终端中的 Ctrl 键）；有些程序可能根本不显示它们。

Windows 控制台源自 MS-DOS，它以在IBM PC 代码页– 当字节 0x02 和 0x03 直接放入视频 RAM 时，PC 将显示☻相应♥的内容。

这是什么角色？

答案1

相关内容