一种根据第一列将文本文件拆分成任意块的方法?

一种根据第一列将文本文件拆分成任意块的方法?

我有一个(非常大的)文本文件,形式为......

/folder1/fileA
/folder1/fileB
/folder1/fileC
...
/folder999/fileA
/folder999/fileB
/folder999/fileC
...etc

每个文件夹的条目数未知,文件夹编号不一定是连续的。我最终想要提取的是另一个列表,告诉我此文件中显示的文件夹,例如

folder1
folder7   
folder76
...etc

但我似乎无法弄清楚 sed、awk 或通用脚本的哪种组合能够告诉我这一点。

如果有人有任何想法,我们将不胜感激。

答案1

您可以使用cut

cut -d/ -f2 verylarge.txt | sort -u
  • -d定义列分隔符

  • sort -u统一列表,即每个文件夹只列出一次。

相关内容