UNICODE 双向文本字符

UNICODE 双向文本字符

需要处理使用双向字符串的恶意软件。它们没有得到广泛的记录,我在一个地方找到了一部分,在另一个地方找到了一部分。目前我有这些:

 1. LRM - 0x200E
 2. RLM - 0x200F
 3. LRE - 0x202A
 4. RLE - 0x202B
 5. PDF - 0x202C
 6. LRO - 0x202D
 7. RLO - 0x202E

我想问一下是不是都是UNICODE特殊字符,或者我遗漏了什么。

答案1

是的,它们是与方向性相关的 Unicode 字符。它们用于控制书写方向;它们是不可见的控制字符,即它们不会以图形方式显示,但它们可能会影响可打印字符的呈现方式(从左到右与从右到左的书写方向)。它们的效果在 Unicode 标准附件 #9 中有规范定义, Unicode 双向算法

一般来说,要通过 Unicode 编号(代码点)查找特定字符的信息,Unicode 字符搜索Fileformat.info 是一个很好的起点。

相关内容