这些转义代码/序列是什么?

这些转义代码/序列是什么?

在 Excel 中搜索文本序列却一无所获,这让我快要疯了。我从 Digi-Key 网站 (digi-key.com) 复制粘贴搜索词,然后在 Excel 数据库中进行搜索。

当我不小心单击 MINGW64 窗口中间时,我终于明白了出了什么问题:

图片:

当我双击文本“BRL2012T2R2M”并将其粘贴到 MINGW64 窗口中时,秘密就揭晓了:该文本实际上是 \342\200\216‎BRL2012T2R2M‎\342\200\216(附照片)

这些控制代码是什么?为什么当我将粘贴内容转储到记事本中然后重新复制时,Windows 也会拾取它们?

答案1

bash 显示的\342\200\216都是 C 风格的八进制转义,也可以写成十六进制\xE2\x80\x8E

这些字节E2 80 8E(十六进制)是 Unicode 代码点值 U+200E 的 UTF-8 编码,这是一个不可见的字符,称为从左到右标记

它表示即使周围的文本通常是从右到左阅读的(某些语言就是如此,例如阿拉伯语),下面的文本也是从左到右阅读的。网站作者很可能添加这些标记,以确保当网站的界面切换到这些语言时,该部分的名称不会损坏。

这篇 W3C 文章了解内联双向标记的介绍。

相关内容