八进制 302 240 在一起似乎对应于不间断空格

Question 1

它是 U+00A0 Unicode 字符的 UTF-8 编码：

$ unicode U+00A0
U+00A0 NO-BREAK SPACE
UTF-8: c2 a0 UTF-16BE: 00a0 Decimal: &#160; Octal: \0240
 
Category: Zs (Separator, Space)
Bidi: CS (Common Number Separator)
Decomposition: <noBreak> 0020

$ locale charmap
UTF-8
$ printf '\ua0' | od -to1
0000000 302 240
0000002

UTF-8 是 Unicode 的一种编码，每个字符的字节数可变。 Unicode 作为字符集是 iso8859-1（又名 latin1）的超集，本身是 ASCII 的超集。

在 iso8859-1 中，不间断空格字符（iso8859-1 中的代码点 0xa0，如 Unicode 中的代码点）将表示为一个 0xa0 字节，而在 UTF-8 中，只有代码点 0 到 127 被表示为一个字节（这使得 UTF-8 成为 ASCII 的超集，换句话说，ASCII 文件也是 UTF-8 文件）。

超过 128 的代码点使用每个字符更多的字节进行编码。看维基百科有关 UTF-8 编码算法的详细信息。

Answer

它是 U+00A0 Unicode 字符的 UTF-8 编码：

$ unicode U+00A0
U+00A0 NO-BREAK SPACE
UTF-8: c2 a0 UTF-16BE: 00a0 Decimal: &#160; Octal: \0240
 
Category: Zs (Separator, Space)
Bidi: CS (Common Number Separator)
Decomposition: <noBreak> 0020

$ locale charmap
UTF-8
$ printf '\ua0' | od -to1
0000000 302 240
0000002

UTF-8 是 Unicode 的一种编码，每个字符的字节数可变。 Unicode 作为字符集是 iso8859-1（又名 latin1）的超集，本身是 ASCII 的超集。

在 iso8859-1 中，不间断空格字符（iso8859-1 中的代码点 0xa0，如 Unicode 中的代码点）将表示为一个 0xa0 字节，而在 UTF-8 中，只有代码点 0 到 127 被表示为一个字节（这使得 UTF-8 成为 ASCII 的超集，换句话说，ASCII 文件也是 UTF-8 文件）。

超过 128 的代码点使用每个字符更多的字节进行编码。看维基百科有关 UTF-8 编码算法的详细信息。

Question 2

Alt-Gr302 240 是+的组合space。

在法语键盘上，当您想在 a 后面键入空格时，|很容易在您想要 + 时键入Alt-gr+ | Alt-gr+ ，然后会出现错误。spaceAlt-gr| space

Answer

Alt-Gr302 240 是+的组合space。

在法语键盘上，当您想在 a 后面键入空格时，|很容易在您想要 + 时键入Alt-gr+ | Alt-gr+ ，然后会出现错误。spaceAlt-gr| space

八进制 302 240 在一起似乎对应于不间断空格

答案1

答案2

相关内容