如何合并 TSV 文件

Question 1

使用 awk：

$ awk '
    BEGIN{OFS=FS="\t"} 
    FNR==1{f = f "\t" FILENAME} 
    NR==FNR{a[$1] = $2} 
    NR!=FNR{a[$1] = a[$1] "\t" $2} 
    END{printf "dataset%s\n", f; for(i in a) print i, a[i]}
  ' file_{1..4}
dataset file_1  file_2  file_3  file_4
def     3       4       5       2
abc     1       10      8       4
ghi     5       7       1       1

如果您需要排序输出，请通过管道传输结果sort或（假设 GNU awk 4.0 或更高版本）添加PROCINFO["sorted_in"] = "@ind_str_asc"或BEGIN块END。

使用磨坊主

$ cat file_{1..4} | mlr --tsv --implicit-csv-header --headerless-csv-output --quote-none \
    nest --implode --values --across-records -f 2 --nested-fs tab
abc     1       10      8       4
def     3       4       5       2
ghi     5       7       1       1

使用足够新的 Miller 版本，你可以使用简写nest --ivar tab -f 2代替nest --implode --values --across-records -f 2 --nested-fs tab

Answer

使用 awk：

$ awk '
    BEGIN{OFS=FS="\t"} 
    FNR==1{f = f "\t" FILENAME} 
    NR==FNR{a[$1] = $2} 
    NR!=FNR{a[$1] = a[$1] "\t" $2} 
    END{printf "dataset%s\n", f; for(i in a) print i, a[i]}
  ' file_{1..4}
dataset file_1  file_2  file_3  file_4
def     3       4       5       2
abc     1       10      8       4
ghi     5       7       1       1

如果您需要排序输出，请通过管道传输结果sort或（假设 GNU awk 4.0 或更高版本）添加PROCINFO["sorted_in"] = "@ind_str_asc"或BEGIN块END。

使用磨坊主

$ cat file_{1..4} | mlr --tsv --implicit-csv-header --headerless-csv-output --quote-none \
    nest --implode --values --across-records -f 2 --nested-fs tab
abc     1       10      8       4
def     3       4       5       2
ghi     5       7       1       1

使用足够新的 Miller 版本，你可以使用简写nest --ivar tab -f 2代替nest --implode --values --across-records -f 2 --nested-fs tab

Question 2

使用 Miller (https://github.com/johnkerl/miller）并运行

mlr -N --tsv nest --ivar ";" -f 2 then nest --explode --values --across-fields -f 2 0*.tsv

你将会拥有

abc     1       10      8       4
def     3       4       5       2
ghi     5       7       1       1

Answer

使用 Miller (https://github.com/johnkerl/miller）并运行

mlr -N --tsv nest --ivar ";" -f 2 then nest --explode --values --across-fields -f 2 0*.tsv

你将会拥有

abc     1       10      8       4
def     3       4       5       2
ghi     5       7       1       1

如何合并 TSV 文件

答案1

答案2

相关内容