在awk中转换文件中的特定数字

在awk中转换文件中的特定数字

我有一个大问题。我有一个像这样的文件:

   18   13    8    5        3       1.715   2.845   1.046  -5.607  -0.000   0.000
   38   34   29   24        3       1.715   2.845   1.046  -5.607  -0.000   0.000
   12   14    9    5        3       1.715   2.845   1.046  -5.607  -0.000   0.000
   34   29   24   30        3       1.715   2.845   1.046  -5.607  -0.000   0.000
   14    9    5    3        3       1.715   2.845   1.046  -5.607  -0.000   0.000
   13    8    5    3        3       1.715   2.845   1.046  -5.607  -0.000   0.000
   34   29   24   28        3       1.590   4.770   0.000  -6.360  -0.000   0.000
   13    8    5    7        3       1.590   4.770   0.000  -6.360  -0.000   0.000
   14    9    5    7        3       1.590   4.770   0.000  -6.360  -0.000   
    7    5    3    6        3       0.628   1.883   0.000  -2.510  -0.000   0.000
    7    5    3    4        3       0.628   1.883   0.000  -2.510  -0.000   0.000
    7    5    3    2        3       0.979   2.937   0.000  -3.916  -0.000   0.0000.000
   14    9    5    8        3      -6.458   0.810   5.682  -0.033  -0.000   0.000
   13    8    5    9        3      -6.458   0.810   5.682  -0.033  -0.000   0.000
   34   29   24   22        3      -6.458   0.810   5.682  -0.033  -0.000   0.000
etc

我使用 gsub 将特定数字替换为特定数字,例如:

awk '{ gsub(/1/, "9"); gsub(/2/, "8"); gsub(/3/, "6"); gsub(/4/, "7"); gsub(/5/, "4"); gsub(/6/, "10"); gsub(/7/, "5"); gsub(/82/, "92"); gsub(/83/, "91"); gsub(/84/, "94"); gsub(/85/, "93"); gsub(/86/, "97"); gsub(/87/, "95"); gsub(/88/, "96"); etc.....
print $1, $2, $3, $4 }' proba | tee proba2

但我有一个问题。例如,我想将 111 替换为 45,所以我使用 gsub 并在我的文档中包含 45,然后在我的脚本中我再次使用 gsub 并将 4 替换为 76,这将 4 替换为 76,但也将 45 替换为 765! - 我不想那样。

我尝试这段代码,但它不起作用

awk '{ gsub(/ 1 /, " 9 "); gsub(/ 2 /, " 8 "); gsub(/ 3 /, " 6 "); gsub(/ 4 /, " 7 "); gsub(/ 5 /, " 4 "); gsub(/ 6 /, " 10 "); gsub(/ 7 /, " 5 "); gsub(/ 8 /, " 23 "); gsub(/ 9 /, " 3 "); gsub(/ 10 /, " 11 "); gsub(/ 11 /, " 12 ");  print $1, $2, $3, $4 }' proba | tee proba2

我想替换整数。我不想12成为98。我想替换四列中的整数(打印 $1、$2、$3、$4)。例如输入格式:22 56 3 75例如输出格式35 82 91 5与输入具有相同的格式很好,但这并不是那么重要。 (之后我可以自己编辑格式)

答案1

我建议创建一个文件,例如replace.txt包含替换内容、第 1 列中的旧值、第 2 列中的新值,如下所示

1 9
2 8
3 6
4 7
5 4
6 10
7 5
82 92
83 91
84 94
85 93
86 97
87 95
88 96

假设您的数据文件是data.txt,您可以使用以下 AWK 脚本:

awk 'NR==FNR { t[$1]=$2; next;} # fill translation table from first file
{ for(i=1;i<5;i++) { # process columns 1..4
        if ($i in t) { # replacement available
                $i=t[$i]; # replace field only once
        }
  }
  print $1, $2, $3, $4;
  # or if you want all columns:
  # $1=$1 # this makes sure unmodified lines get the new format
  # print # print all fields after modification
}' replace.txt data.txt

根据您的输入,这会生成

18 13 8 4
38 34 29 24
12 14 9 4
34 29 24 30
14 9 4 6
13 8 4 6
34 29 24 28
13 8 4 5
14 9 4 5
5 4 6 10
5 4 6 7
5 4 6 8
14 9 4 8
13 8 4 9
34 29 24 22

或使用替代输出

18 13 8 4 3 1.715 2.845 1.046 -5.607 -0.000 0.000
38 34 29 24 3 1.715 2.845 1.046 -5.607 -0.000 0.000
12 14 9 4 3 1.715 2.845 1.046 -5.607 -0.000 0.000
34 29 24 30 3 1.715 2.845 1.046 -5.607 -0.000 0.000
14 9 4 6 3 1.715 2.845 1.046 -5.607 -0.000 0.000
13 8 4 6 3 1.715 2.845 1.046 -5.607 -0.000 0.000
34 29 24 28 3 1.590 4.770 0.000 -6.360 -0.000 0.000
13 8 4 5 3 1.590 4.770 0.000 -6.360 -0.000 0.000
14 9 4 5 3 1.590 4.770 0.000 -6.360 -0.000
5 4 6 10 3 0.628 1.883 0.000 -2.510 -0.000 0.000
5 4 6 7 3 0.628 1.883 0.000 -2.510 -0.000 0.000
5 4 6 8 3 0.979 2.937 0.000 -3.916 -0.000 0.0000.000
14 9 4 8 3 -6.458 0.810 5.682 -0.033 -0.000 0.000
13 8 4 9 3 -6.458 0.810 5.682 -0.033 -0.000 0.000
34 29 24 22 3 -6.458 0.810 5.682 -0.033 -0.000 0.000

相关内容