答案1
Unicode 是用于映射人物/字形数字。它只处理纯文本不适用于格式化文本
富文本。也称为样式文本。向纯文本添加信息的结果。可以添加的信息示例包括字体数据、颜色、格式信息、语音注释、行间文本等。Unicode 标准并未解决富文本的表示问题。预计系统和应用程序将实现富文本的专有形式。富文本有几种公共格式可供选择(例如 ODA、HTML 和 SGML)。当富文本中除主要内容以外的所有内容被删除后,应该只保留纯文本。
你不能写信大胆的,斜体或者仅使用 Unicode 代码点将字母移动到基线上方或下方(请参阅使用组合字形创建 Unicode 下标和上标因此它也无法格式化数学表达式(除了非常简单的表达式)。有很多单杠在 Unicode 中,但上下数字均不能作为单个分数
这意味着,如果您真的想要带有水平线的分数,则必须使用数学渲染工具,例如 LaTeX、MS Equation Editor、MathType、MathML……因为数学表达式只是一种富文本。使用纯 Unicode,您只能使用斜线分数。有一些内置的斜线,例如 ⅔、¼、⅝ 和斜线/
或分数斜线⁄
,用于使用数字的任意分数下标和上标块:⁰¹²³⁴⁵⁶⁷⁸⁹₀₁₂₃₄₅₆₇₈₉。例如,你可以有 ⁴⁶⁵/₁₀₈₉(斜线)或 ⁷⁸¹⁵⁄₆₉₂₃(分数斜线)。许多字体渲染器聪明的足以克恩⁄
如上例所示,U+2044 小数斜线前后的数字
来自 Unicode 标准的更多参考资料:
问:富文本和纯文本有什么区别?
A:富文本是包含所有格式信息的文本:字体、磅值、粗细、字距等。纯文本是应用格式的底层内容流。
两者之间的一个主要区别是,富文本将文本拆分成多个运行,并对每个运行应用统一的格式。因此,富文本本质上是有状态的。纯文本没有状态。应该可以丢失纯文本块的前半部分而不会对渲染产生任何影响。
Unicode 的设计只适用于纯文本。它无法为富文本问题提供通用的解决方案。
问:为什么 Unicode 没有完整的上标和下标?
A:Unicode 中编码的上标和下标字符要么是为从旧标准进行数据往返转换而编码的兼容字符,要么实际上是在 IPA 和 UPA 等技术转录系统中具有特定含义的修饰字母。这些字符不适用于任意文本字符串的一般上标或下标 - 对于此类文本效果,您应改用富文本中的文本样式或标记。