我有一个段落,我想知道哪个单词在所有段落的行首出现最多
例如: 段落:
Hello my name is X
Nice to meet you
Hello my name is Y
所以 Hello 出现了 2 次所以我会输出 hello
答案1
awk -v RS= '
{word = tolower($1); n = ++count[word]}
n > max {max_word = word; max = n}
END {print max_word}'
答案2
下面的命令将为您提供所需的最重复单词以及计数。
cut -d ' ' -f1 file.txt | sort | uniq -c | head -1
答案3
尝试使用下面的关联数组方法
awk 'NF{a[$1]++}END{for(x in a){print x" appears "a[x]}}' | sort -k3 -nr | sed -n '1p'
输出:
Hello appears 2
答案4
为什么不简单... awk '{ print $1 }' myfile |uniq -c