用低于阈值的零值替换,但从特定单元格开始

用低于阈值的零值替换,但从特定单元格开始

我有一个矩阵,如果所有值低于 25,我想用 0 替换它们。我想保留第一行和第一列。

         p1    p10  p16 p19 p25 p3  p5  p6  p8  p9
call1   567     0   3   0   18  17  8   4   6   7
call20  4900    7   6   2   23  26  20  14  12  29
echo34  73784   1   4   1   6   4   1   4   8   5
kol45   145873  6   4   0   11  17  5   9   22  11

当我删除这些值时,我也删除了行和列名称,但我不希望这样。

答案1

你可以试试这个 awk

awk 'NR>1{for(i=2;i<=NF;i++)$i=$i<25?0:$i}1' infile

NR>1 保留第一行
i=2 保留第一列

答案2

使用 R:

dat <- as.matrix(read.table(text="p1    p10  p16 p19 p25 p3  p5  p6  p8  p9
call1   567     0   3   0   18  17  8   4   6   7
call20  4900    7   6   2   23  26  20  14  12  29
echo34  73784   1   4   1   6   4   1   4   8   5
kol45   145873  6   4   0   11  17  5   9   22  11"))

dat
#            p1 p10 p16 p19 p25 p3 p5 p6 p8 p9
# call1     567   0   3   0  18 17  8  4  6  7
# call20   4900   7   6   2  23 26 20 14 12 29
# echo34  73784   1   4   1   6  4  1  4  8  5
# kol45  145873   6   4   0  11 17  5  9 22 11

dat[-1, -1][dat[-1, -1] < 25] <- 0

dat
#            p1 p10 p16 p19 p25 p3 p5 p6 p8 p9
# call1     567   0   3   0  18 17  8  4  6  7
# call20   4900   0   0   0   0 26  0  0  0 29
# echo34  73784   0   0   0   0  0  0  0  0  0
# kol45  145873   0   0   0   0  0  0  0  0  0

答案3

这似乎可以解决问题:

$ awk '{ for (field=1;field<=NF;field++) { if( NR > 1 && field>=2 && $field < 25 ) { $field=0 } } print }' input
         p1    p10  p16 p19 p25 p3  p5  p6  p8  p9
call1 567 0 0 0 0 0 0 0 0 0
call20 4900 0 0 0 0 26 0 0 0 29
echo34 73784 0 0 0 0 0 0 0 0 0
kol45 145873 0 0 0 0 0 0 0 0 0

答案4

为了保留间距,您可以执行以下操作:

perl -pe '
  if ($. > 1) {
    $skip = 2;
    s{ +\d+}{
      --$skip > 0 || $& >= 25 ? $& : " " x (length($&) - 1) . "0"
    }ge
  }' < file

压缩:

perl -pe'if($.>1){$s=2;s@ +\d+@--$s>0||$&>24?$&:" "x(length($&)-1)."0"@ge}' file

相关内容