有没有一个快速工具可以显示文件中所有唯一的 unicode 字符及其数量?

有没有一个快速工具可以显示文件中所有唯一的 unicode 字符及其数量?

有人知道有一个工具可以将文件中所有唯一的 unicode 字符及其计数制成表格吗?

答案1

我不确定“unicode 字符”到底是什么意思。要计算文件中的不同字符,您可以执行以下操作:

$ awk -v FS="" -v OFS="\t" '{for(i=1;i<=NF;i++) char[$i]++} END { for(i in char) print i,char[i]}' input.txt

我们-v FS=""将字段分隔符设置为空。因此每个字符都作为单个字段处理。在每一行中,我们使用字符作为列表的键来迭代这些字段,并使用 递增计数++。如果读取了所有行,我们将迭代计数列表并打印每个键(代表字符)及其计数。

相关内容