我有这个file1.csv
:
A,dog cat horse cow
B,goat deer fish
A,deer goat
C,dog cat
C,goat
我需要合并相似的行(例如 A 和 C):
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat goat
答案1
和awk
:
$ awk -F, '{a[$1] = a[$1]=="" ? $2 : a[$1] OFS $2} END {for (i in a) printf("%s,%s\n", i, a[i])}' file.csv
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat goat
使用 GNU datamash
+ sed
:
$ datamash -st, groupby 1 collapse 2 < file.csv | sed 's/,/ /2g'
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat goat
请注意,awk 版本不保证输出顺序:如果您有 GNU awk >= 4.0,您可以使用结构来控制输出顺序PROCINFO
。
答案2
您也可以先sort
使用以下命令进行处理awk
:
$ <file1.csv sort -sk1,1.1|awk -F, '{printf(a==$1)?" "$2:(NR<2)?$0:"\n"$0;a=$1}END{print""}'
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat goat