如何通过命令查找文件中重复单词的数量？

Question 1

使用cut和uniq

cut -d" " -f1 | sort | uniq -d

该cut命令提取每行的第一个单词，并sort结合uniq -d仅打印重复的单词。

Answer

使用cut和uniq

cut -d" " -f1 | sort | uniq -d

该cut命令提取每行的第一个单词，并sort结合uniq -d仅打印重复的单词。

Question 2

使用awk：

awk '{a[$1]++} END {for (i in a) if (a[i] > 1) print i}'

这只是计算行中第一个单词 ( ) 出现的次数，$1并将其保存在数组中。然后，循环遍历迄今为止看到的所有数组元素，并打印多次出现的元素。

当然，我已经陷入了循环遍历数组的窠臼END。steeldriver 指出我不需要：

awk 'a[$1]++ == 1' file

Answer

使用awk：

awk '{a[$1]++} END {for (i in a) if (a[i] > 1) print i}'

这只是计算行中第一个单词 ( ) 出现的次数，$1并将其保存在数组中。然后，循环遍历迄今为止看到的所有数组元素，并打印多次出现的元素。

当然，我已经陷入了循环遍历数组的窠臼END。steeldriver 指出我不需要：

awk 'a[$1]++ == 1' file

相关内容