合并列中的重复值

Question 1

不仅仅适用于第 3 列

$ cat file.csv
aaa,bbb,ccc,ddd
aat,bbk,ccc,ddd
aaa,bbk,cc3,dd4
aaa,bbb,ccc,ddd

$ awk '
      BEGIN {FS = OFS = ","}
      NR == 1 {for (i=1; i<=NF; i++) prev[i] = $i}
      NR > 1 {
          for (i=1; i<=NF; i++)
              if ($i == prev[i])
                  gsub(/./, " ", $i)
              else
                  prev[i] = $i
      }
      1
  ' file.csv
aaa,bbb,ccc,ddd
aat,bbk,   ,
aaa,   ,cc3,dd4
   ,bbb,ccc,ddd

Answer

不仅仅适用于第 3 列

$ cat file.csv
aaa,bbb,ccc,ddd
aat,bbk,ccc,ddd
aaa,bbk,cc3,dd4
aaa,bbb,ccc,ddd

$ awk '
      BEGIN {FS = OFS = ","}
      NR == 1 {for (i=1; i<=NF; i++) prev[i] = $i}
      NR > 1 {
          for (i=1; i<=NF; i++)
              if ($i == prev[i])
                  gsub(/./, " ", $i)
              else
                  prev[i] = $i
      }
      1
  ' file.csv
aaa,bbb,ccc,ddd
aat,bbk,   ,
aaa,   ,cc3,dd4
   ,bbb,ccc,ddd

Question 2

和珀尔:

perl -F, -e '
    do{ $col = $F[2]; print; next } if $.==1;
    $F[2] = " "x4 if $F[2] eq $col;
    print join ",", @F
' file

和awk:

awk '
    BEGIN{FS=OFS=","}
    {if (NR==1) col=$1;
    else if($3 == col) $3="    "}
    1
' file

输出

value,value,value,value
value1,value1,    ,value1
value2,value2,    ,value2

Answer

和珀尔:

perl -F, -e '
    do{ $col = $F[2]; print; next } if $.==1;
    $F[2] = " "x4 if $F[2] eq $col;
    print join ",", @F
' file

和awk:

awk '
    BEGIN{FS=OFS=","}
    {if (NR==1) col=$1;
    else if($3 == col) $3="    "}
    1
' file

输出

value,value,value,value
value1,value1,    ,value1
value2,value2,    ,value2

合并列中的重复值

答案1

答案2

和珀尔:

和awk:

输出

相关内容