我想在行开头有固定单词时增加,否则继续使用相同的数字。
输入 :
CH,A11R,Q9Y5X3,SNX5
CD,A12L,Q9Y316,MEMO1
CD,A12L,Q70CQ2,USP34
CT,A12L,Q8N7H5,PAF1
CH,A12L,Q8IZL8,PELP1
CD,A13L,Q5SY16,NOL9
CD,A13L,Q6P1J9,CDC73
CT,A13L,Q8WVC0,LEO1
CH,A13L,Q9Y4W2,LAS1L
CD,A13L,Q6PD62,CTR9
当第一列以 CH 开头时,然后继续下一个数字,否则打印相同的数字
输出 :
CH,A11R,Q9Y5X3,SNX5 ,1
CD,A12L,Q9Y316,MEMO1 ,1
CD,A12L,Q70CQ2,USP34 ,1
CT,A12L,Q8N7H5,PAF1 ,1
CH,A12L,Q8IZL8,PELP1 ,2
CD,A13L,Q5SY16,NOL9 ,2
CD,A13L,Q6P1J9,CDC73 ,2
CT,A13L,Q8WVC0,LEO1 ,2
CH,A13L,Q9Y4W2,LAS1L ,3
CD,A13L,Q6PD62,CTR9 ,3
答案1
对于 (any) awk
,工具箱中必须有:
awk 'BEGIN{FS=OFS=","}$1=="CH"{lc++}{print $0,lc}' file
相同的命令,但随着多行分解更容易理解:
awk '
BEGIN{FS=OFS=","} # set input and output fields separator as ","
$1=="CH"{lc++} # if $1(first column)==CH, increment lc (last column)
{print $0,lc} # print current line and the variable lc
' file
如果你需要输出按原样:
awk 'BEGIN{FS=OFS=","}$1=="CH"{lc++}{printf("%-20s,%d\n", $0,lc)}' file
CH,A11R,Q9Y5X3,SNX5 ,1
CD,A12L,Q9Y316,MEMO1,1
CD,A12L,Q70CQ2,USP34,1
CT,A12L,Q8N7H5,PAF1 ,1
CH,A12L,Q8IZL8,PELP1,2
CD,A13L,Q5SY16,NOL9 ,2
CD,A13L,Q6P1J9,CDC73,2
CT,A13L,Q8WVC0,LEO1 ,2
CH,A13L,Q9Y4W2,LAS1L,3
CD,A13L,Q6PD62,CTR9 ,3