从文件中获取 N 个最常见的子字符串

从文件中获取 N 个最常见的子字符串

我有一个包含以下格式的字符串的文件:/path1/path2/path3

我想通过 unix 命令行显示N最常见的子字符串。path2

你能给我一些指导吗?

答案1

cat <your_file> | cut -d "/" -f 3 | sort | uniq -c | sort -rg | head -n <N> | awk '{print $2}'

和:

  • cut -d "/" -f 3:提取“path2”字符串
  • sort | uniq -c | sort -rg:统计每个“path2”字符串的出现次数并排序
  • head -n <N> | awk '{print $2}':打印前 N 个

相关内容