如何用序列号替换 CSV 中的第一个元素?

如何用序列号替换 CSV 中的第一个元素?

我有一个这样的 csv 文件:

5/05/2017;03;07;30;35;43;01;03
9/05/2017;08;12;16;22;26;06;07
12/05/2017;02;20;28;29;44;03;09
16/05/2017;08;11;15;20;30;03;08
19/05/2017;09;11;12;19;30;04;09
23/05/2017;08;15;25;27;42;01;04
26/05/2017;05;07;26;36;39;02;10
...

也就是说,一个日期,加上一系列数字,后跟;

我需要删除第一个位置的日期,并按顺序从 1004 开始...如下所示:

1004;03;07;30;35;43;01;03
1005;08;12;16;22;26;06;07
1006;02;20;28;29;44;03;09
1007;08;11;15;20;30;03;08
1008;09;11;12;19;30;04;09
1009;08;15;25;27;42;01;04
1010;05;07;26;36;39;02;10
...

我可以使用以下方法删除日期:

cut -f 2-8 -d';' 2.txt | xargs -I{}

但如何按顺序添加一个数字来替换日期呢?

答案1

awk解决方案:

awk -F';' 'BEGIN{ i=1004 }{ $1=i++ }1' OFS=';' file
  • -F';'- 输入字段分隔符

  • i=1004- 开始增量

输出:

1004;03;07;30;35;43;01;03
1005;08;12;16;22;26;06;07
1006;02;20;28;29;44;03;09
1007;08;11;15;20;30;03;08
1008;09;11;12;19;30;04;09
1009;08;15;25;27;42;01;04
1010;05;07;26;36;39;02;10

i或者您可以从“外部”传递变量:

awk -F';' '{ $1=i++ }1' i=1004 OFS=';' file

答案2

  • awk

    awk -v cnt=1004 '{ sub("^[^;]+", cnt++) } 1' file.csv
    
  • 带壳:

    cnt=1004
    while read -r line; do
        printf '%d;%s\n' $cnt "${line#*;}"
        let cnt++
    done <file.csv
    
  • 使用jotpaste和一个可以处理<(...)重定向的 shell:

    paste -d\; <(jot $(wc -l <file.csv) 1004) <(cut -d\; -f2- file.csv)
    
  • 使用 Vim:

    :let cnt=1004 | g/^/ s/^[^;]\+/\=cnt/ | let cnt+=1
    
  • 使用 Perl:

    perl -F\; -lpe 'BEGIN{ $cnt=1004 } $F[0]=$cnt++; $_=join ";", @F' file.csv
    

答案3

使用 Python,它易于阅读、理解和维护 - 并且可在大多数 Unix 安装上使用:

python - << "EOF" > outfilename
for index, line in enumerate(open("filename"), start=1004):
    linedata = line.strip().split(';')
    linedata[0] = str(index)
    print(';'.join(linedata))
EOF

相关内容