CSV:连接更多行数据

CSV:连接更多行数据

我有这个file1.csv

A,dog cat horse cow
B,goat deer fish
A,deer goat 
C,dog cat 
C,goat

我需要合并相似的行(例如 A 和 C):

A,dog cat horse cow deer goat 
B,goat deer fish
C,dog cat goat

答案1

awk

$ awk -F, '{a[$1] = a[$1]=="" ? $2 : a[$1] OFS $2} END {for (i in a) printf("%s,%s\n", i, a[i])}' file.csv
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat  goat

使用 GNU datamash+ sed

$ datamash -st, groupby 1 collapse 2 < file.csv | sed 's/,/ /2g'
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat  goat

请注意,awk 版本不保证输出顺序:如果您有 GNU awk >= 4.0,您可以使用结构来控制输出顺序PROCINFO

答案2

您也可以先sort使用以下命令进行处理awk

$ <file1.csv sort -sk1,1.1|awk -F, '{printf(a==$1)?" "$2:(NR<2)?$0:"\n"$0;a=$1}END{print""}'
A,dog cat horse cow deer goat
B,goat deer fish
C,dog cat goat

相关内容