列出重复的单词

列出重复的单词

我有一个如下文件:

(aa,((bb,cc),dd));
(((aa,cc),ee),(ff,gg));
((aa,ff),hh);

每条线实际上代表了纽威克格式。我想列出所有有重复的名称,即出现次数>1。例如,在这种情况下,输出为:

aa, cc, ff

答案1

tr -cs '[:alpha:]' '\n' < file | sort | uniq -d | paste -sd,

tr命令将所有非字母序列转换为换行符

相关内容