在 shell 中打印给定 UTF-8 代码单元的字素

在 shell 中打印给定 UTF-8 代码单元的字素

我有一个包含笑脸代码单元列表的文件,我需要另一个包含“字位表示”的文件,以便将它们提供给 grep。如果我在 shell 中直接回显代码单元,它就会顺利转换:

echo $'\xF0\x9F\x98\x81'

答案1

$'...'语法不是某种神奇的“UTF-8 代码单元”符号,也不是echo对其进行解释。这是你的外壳就是这样的——这是执行类似 C 语言的反斜杠扩展的 Bash 语法,系统实际上运行echo

相关内容