如何添加一个带有数字或字符串的列，每次在其他列上找到数字时，该数字或字符串都会发生变化？

Question 1

使用 AWK，并使用一个单独的文件列出要添加的名称：

#!/usr/bin/awk -f

BEGIN { FS = "\t"; OFS = FS; idx = 0 }
FNR == NR { names[NR] = $0 }
FNR < NR && $1 == 1 { idx++ }
FNR < NR { $(NF + 1) = names[idx]; print }

这将 AWK 设置为使用制表符作为输入和输出的字段分隔符。假定第一个文件包含要添加的名称；这被读入names数组。一旦我们移动到第一个之后的文件，在检查第一个字段是否为 1 并增加数组索引（如果是）之后，我们将当前名称添加到行尾。

没有单独的姓名列表：

#!/usr/bin/awk -f

BEGIN { FS = "\t"; OFS = FS; idx = 0 }
$1 == 1 { idx++ }
{ $(NF + 1) = sprintf("Replicate_%c", 64 + idx); print }

在这两种情况下，都没有错误处理。在第一个变体中，一旦名称用完，将使用空字符串。在第二部分中，您将探索 Z 之后的角色集......

Answer

使用 AWK，并使用一个单独的文件列出要添加的名称：

#!/usr/bin/awk -f

BEGIN { FS = "\t"; OFS = FS; idx = 0 }
FNR == NR { names[NR] = $0 }
FNR < NR && $1 == 1 { idx++ }
FNR < NR { $(NF + 1) = names[idx]; print }

这将 AWK 设置为使用制表符作为输入和输出的字段分隔符。假定第一个文件包含要添加的名称；这被读入names数组。一旦我们移动到第一个之后的文件，在检查第一个字段是否为 1 并增加数组索引（如果是）之后，我们将当前名称添加到行尾。

没有单独的姓名列表：

#!/usr/bin/awk -f

BEGIN { FS = "\t"; OFS = FS; idx = 0 }
$1 == 1 { idx++ }
{ $(NF + 1) = sprintf("Replicate_%c", 64 + idx); print }

在这两种情况下，都没有错误处理。在第一个变体中，一旦名称用完，将使用空字符串。在第二部分中，您将探索 Z 之后的角色集......

Question 2

如果您可以使用数字而不是字母，则可以在 awk 中轻松执行此操作（file具有在示例数据上运行的输出sed -i 's/ */\t/g'，用制表符替换所有连续空格，因为您说数据是制表符分隔的）：

$ awk -F"\t" -vOFS="\t" '{if($1==1){num++}{print $0,"Replicate_"num}}' file 
1   x   x       Replicate_1
2   x   x       Replicate_1
3   x   x       Replicate_1
4   x   x       Replicate_1
1   x   x       Replicate_2
2   x   x       Replicate_2
3   x   x       Replicate_2
1   x   x       Replicate_3
2   x   x       Replicate_3
3   x   x   Replicate_3

如果你需要字母，那就有点复杂，但也不算太糟糕：

$ awk '{
        if(NR==FNR){
            a[++n]=$1
        }
        else{
            if($1==1){
                num++
            }
            print $0,"Replicate_"a[num]
        }
       }' <(printf '%s\n' {A..Z}) file
1   x   x    Replicate_A
2   x   x    Replicate_A
3   x   x    Replicate_A
4   x   x    Replicate_A
1   x   x    Replicate_B
2   x   x    Replicate_B
3   x   x    Replicate_B
1   x   x    Replicate_C
2   x   x    Replicate_C
3   x   x Replicate_C

Answer

如果您可以使用数字而不是字母，则可以在 awk 中轻松执行此操作（file具有在示例数据上运行的输出sed -i 's/ */\t/g'，用制表符替换所有连续空格，因为您说数据是制表符分隔的）：

$ awk -F"\t" -vOFS="\t" '{if($1==1){num++}{print $0,"Replicate_"num}}' file 
1   x   x       Replicate_1
2   x   x       Replicate_1
3   x   x       Replicate_1
4   x   x       Replicate_1
1   x   x       Replicate_2
2   x   x       Replicate_2
3   x   x       Replicate_2
1   x   x       Replicate_3
2   x   x       Replicate_3
3   x   x   Replicate_3

如果你需要字母，那就有点复杂，但也不算太糟糕：

$ awk '{
        if(NR==FNR){
            a[++n]=$1
        }
        else{
            if($1==1){
                num++
            }
            print $0,"Replicate_"a[num]
        }
       }' <(printf '%s\n' {A..Z}) file
1   x   x    Replicate_A
2   x   x    Replicate_A
3   x   x    Replicate_A
4   x   x    Replicate_A
1   x   x    Replicate_B
2   x   x    Replicate_B
3   x   x    Replicate_B
1   x   x    Replicate_C
2   x   x    Replicate_C
3   x   x Replicate_C

如何添加一个带有数字或字符串的列，每次在其他列上找到数字时，该数字或字符串都会发生变化？

答案1

答案2

相关内容