Unicode 属于哪一分类?

Unicode 属于哪一分类?

Unicode 被认为是哪种类型的代码语言?

它不是一种编程语言,而且它看起来更接近 HTML,所以我认为它可能是标记,但是......在功能方面,HTML 和 Unicode 之间存在一些重要差异,所以我不确定。

答案1

统一码根本不是一种语言。它是一种字符编码,或者换句话说,它是一种解释一组二进制位来表示书面字符的方法。

答案2

Unicode 根本不是一种语言,就像字母表本身不是英语一样。它是字母以特定组合(单词)的形式组合而成,赋予其意义。它是为唯一符号分配唯一代码的标准。

一个 = U+0041
一个 = U+0061
! = U+0021
Ω = U+03A9

维基百科

编辑SarahofGaia:正如 @heavyd 所说,HTML 是一种标记语言,它控制着元素在网站上的显示方式。编程语言决定着计算机要采取的操作。Unicode 本身不会“做”任何事情。

打个比方,Unicode 可以想象成一块砖。就其本身而言,它只是一块砖。你可以有红砖、黄砖、大砖、小砖等等,但它什么也不做。现在想象一下一座砖房,你有许多种砖:地基砖、墙砖、烟囱砖等等,它们共同作用,形成一座房子。房子可以是任何东西,一个网站、一个程序、你的高级英语研究论文,所有这些都是由 Unicode 组成的。你可以用任意数量的“材料”建造同一个“房子”:木材(ASCII)、钢铁(UTF-8)等等。 以下是一些有关字符编码的更多一般信息。

答案3

Unicode 是一种编码方案,而不是标记语言或任何类型的语言。例如,编码方案用于读取/写入标记语言的文本。

计算机/CPU 的核心(以及它们被发明的原因 - 以及它们被称为的原因)是计算rs)只不过是真正快速的计算器。我相信你以前听说过,计算机只能与个人或 1 和 0。确实如此,但大多数 CPU 操作都是在 8 位(字节)或 16 位(字)或更多(32、64 等)的集合上进行的。

本质上:CPU 只处理数字,没有其他事情。在内部,CPU 中的一切都是数字。

当然,早期人们也希望用计算机对文本进行运算——至少能够打印出包含数字以外内容的报告。

计算机还可以控制外部设备 - 例如,电传打字机就是早期的此类设备。

我们可以编写一个程序来与电传打字机对话 - 但当然我们想做的不仅仅是向它发送数字。我们希望向它发送字母、标点符号和其他构成可理解文本的符号。设备如何呈现文本取决于设备,但需要某种方案为每个符号分配一个数字。这样 CPU 就可以随心所欲地处理数字,但每个数字“代表”一个符号。这就是 Unicode。

Baudot 是一种早期方案(可追溯到 1874 年!),其次是 EBCIDC 和 ASCII。EBCIDC 被 IBM 广泛使用,并且仍在其现代大型机级系统中使用。ASCII 被广泛使用,但仅限于拉丁字符。Unicode(ASCII 是其子集)是当今使用的常见方案,可以使用它的子集,例如 UTF-8(本质上与 ASCII 相同)。

现在,有了 HTML,你就可以用显示器阅读并理解文本。在 RAM 内部,Unicode 用于表示 HTML 文档在内存、磁盘和网络传输中的每个符号。你的操作系统会遍历 RAM 的每个字节,并使用图形库、数字或代码点作为索引,以便您可以查看屏幕上看到的部分。

对于浏览器来说,当你的浏览器收到页面时,它必须浏览页面的每个字节,并且解析所有元素。归结到最低级别,这涉及寻找数字模式。例如,在 UTF-8 中,稍微简化一下,<div>将是 (十六进制) 3C 64 69 76 3E,当浏览器的解析器找到该数字序列时,它就知道它找到了标签的开头div,并且可以采取适当的措施。

HTML 位于编码方案的“之上”,并且如果您愿意,可以使用 ASCII 或 EBCIDC,只要需要处理 HTML 的应用程序(文本编辑器、浏览器)了解编码方法。

相关内容