我有一个(非常大的)文本文件,形式为......
/folder1/fileA
/folder1/fileB
/folder1/fileC
...
/folder999/fileA
/folder999/fileB
/folder999/fileC
...etc
每个文件夹的条目数未知,文件夹编号不一定是连续的。我最终想要提取的是另一个列表,告诉我此文件中显示的文件夹,例如
folder1
folder7
folder76
...etc
但我似乎无法弄清楚 sed、awk 或通用脚本的哪种组合能够告诉我这一点。
如果有人有任何想法,我们将不胜感激。
答案1
您可以使用cut
:
cut -d/ -f2 verylarge.txt | sort -u
-d
定义列分隔符sort -u
统一列表,即每个文件夹只列出一次。