根据特定列中的值拆分文件

Question

$ gawk '{print > "file" ++a[$1] ".txt"}' input

# And on OSX awk, and also gawk:

$ awk '{print > ("file" ++a[$1] ".txt")}' input


$ head file*txt
==> file1.txt <==
1    Cat
2    Boy
3    Tree

==> file2.txt <==
1    Dog
2    Girl
3    Leaf

==> file3.txt <==
1    Frog
3    Branch

==> file4.txt <==
3    Trunk

编辑：一个解释。这会将当前行打印到 ( >)中fileX.txt。每次找到第一个字段时，数组a[$1]都会在求值之前加 1。这用于建立文件名。

编辑2：我无法使用 OSX awk 进行检查，但我想如果您对使用 awk 不太认真，那么安装gawk或会很好mawk。不过，你可以尝试一下：

$ awk '{a[$1]++; f = "file" a[$1] ".txt"; print > f}' input

其作用相同，但所有操作都分为单独的步骤。这是为了帮助 OSX awk 理解评估各部分的正确顺序。

Answer 1

$ gawk '{print > "file" ++a[$1] ".txt"}' input

# And on OSX awk, and also gawk:

$ awk '{print > ("file" ++a[$1] ".txt")}' input


$ head file*txt
==> file1.txt <==
1    Cat
2    Boy
3    Tree

==> file2.txt <==
1    Dog
2    Girl
3    Leaf

==> file3.txt <==
1    Frog
3    Branch

==> file4.txt <==
3    Trunk

编辑：一个解释。这会将当前行打印到 ( >)中fileX.txt。每次找到第一个字段时，数组a[$1]都会在求值之前加 1。这用于建立文件名。

编辑2：我无法使用 OSX awk 进行检查，但我想如果您对使用 awk 不太认真，那么安装gawk或会很好mawk。不过，你可以尝试一下：

$ awk '{a[$1]++; f = "file" a[$1] ".txt"; print > f}' input

其作用相同，但所有操作都分为单独的步骤。这是为了帮助 OSX awk 理解评估各部分的正确顺序。

根据特定列中的值拆分文件

答案1

相关内容