列表按第一个字段排序，如何在第一个字段相同的行上加入第二个字段？

Question 1

带sort+awk管道：

sort -k1,1 file \
| awk 'url && $1 != url{ print url, acc }
      { acc = ($1 == url? acc FS:"") $2; url = $1 }END{ print url, acc }' OFS='\t'

示例输出：

url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

Answer

带sort+awk管道：

sort -k1,1 file \
| awk 'url && $1 != url{ print url, acc }
      { acc = ($1 == url? acc FS:"") $2; url = $1 }END{ print url, acc }' OFS='\t'

示例输出：

url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

Question 2

使用 GNU datamash：

$ datamash -W -g 1 collapse 2 < input.txt
url1    acct2
url2    acct1
url3    acct1,acct2
url4    acct2,acct3,acct5

选项：

您可以使用以下命令将逗号转换为空格tr：

$ datamash -W -g 1 collapse 2 < input.txt | tr ',' ' '
url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

如果您需要对第一个字段的输出进行排序，请添加-s：

datamash -s -W -g 1 collapse 2 < input.txt | tr ',' ' '

Answer

使用 GNU datamash：

$ datamash -W -g 1 collapse 2 < input.txt
url1    acct2
url2    acct1
url3    acct1,acct2
url4    acct2,acct3,acct5

选项：

您可以使用以下命令将逗号转换为空格tr：

$ datamash -W -g 1 collapse 2 < input.txt | tr ',' ' '
url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

如果您需要对第一个字段的输出进行排序，请添加-s：

datamash -s -W -g 1 collapse 2 < input.txt | tr ',' ' '

相关内容