删除特定行

Question 1

因为它被标记为 awk

awk -F", *" 'x!=$1||$2>=y+10{y=$2;print}{x=$1}' file


Test1,  0.0, 1
Test1, 10.0, 3
Test2,  0.1, 1
Test2, 11.0, 7

Answer

因为它被标记为 awk

awk -F", *" 'x!=$1||$2>=y+10{y=$2;print}{x=$1}' file


Test1,  0.0, 1
Test1, 10.0, 3
Test2,  0.1, 1
Test2, 11.0, 7

Question 2

使用 Perl：

perl -lane 'if($.==1||"$F[0]"ne"$F0"||$F[1]>=$F1+10){print;$F1=@F[1]}$F0=@F[0]' file

展开：

if($. == 1 || "$F[0]" ne "$F0" || $F[1] >= $F1 + 10){
    print;
    $F1 = @F[1]
}
$F0 = @F[0]

if($.==1||"$F[0]"ne"$F0"||$F[1]>=$F1+10){print;$F1=@F[1]}：若当前行号为1，当前行第一个字段等于上一行第一个字段或者当前行第二个字段大于或等于上一行第二个字段，则打印当前行并将当前行第二个字段的值赋给F1；
$F0=@F[0]: 将当前行第一个字段的值赋给F0;

% cat file
Test1,  0.0, 1
Test1,  0.2, 1
Test1, 10.0, 3
Test2,  0.1, 1
Test2,  0.3, 3
Test2,  1.0, 5
Test2, 11.0, 7
% perl -lane 'if($.==1||"$F[0]"ne"$F0"||$F[1]>=$F1+10){print;$F1=@F[1]}$F0=@F[0]' file
Test1,  0.0, 1
Test1, 10.0, 3
Test2,  0.1, 1
Test2, 11.0, 7

Answer

使用 Perl：

perl -lane 'if($.==1||"$F[0]"ne"$F0"||$F[1]>=$F1+10){print;$F1=@F[1]}$F0=@F[0]' file

展开：

if($. == 1 || "$F[0]" ne "$F0" || $F[1] >= $F1 + 10){
    print;
    $F1 = @F[1]
}
$F0 = @F[0]

if($.==1||"$F[0]"ne"$F0"||$F[1]>=$F1+10){print;$F1=@F[1]}：若当前行号为1，当前行第一个字段等于上一行第一个字段或者当前行第二个字段大于或等于上一行第二个字段，则打印当前行并将当前行第二个字段的值赋给F1；
$F0=@F[0]: 将当前行第一个字段的值赋给F0;

% cat file
Test1,  0.0, 1
Test1,  0.2, 1
Test1, 10.0, 3
Test2,  0.1, 1
Test2,  0.3, 3
Test2,  1.0, 5
Test2, 11.0, 7
% perl -lane 'if($.==1||"$F[0]"ne"$F0"||$F[1]>=$F1+10){print;$F1=@F[1]}$F0=@F[0]' file
Test1,  0.0, 1
Test1, 10.0, 3
Test2,  0.1, 1
Test2, 11.0, 7

Question 3

使用 Python 脚本：

#! /usr/bin/env python3
import sys
with open (sys.argv[1]) as f:
  rows=[list(map(str.strip, line.split(','))) for line in f.readlines()]
  result=rows[0:1]
  for r in rows:
    if r[0] != result[-1][0] or float(r[1]) >= float(result[-1][1])+10:
      result.append(r)
  print("\n".join([",".join(res) for res in result]))

复制上述脚本并将其粘贴到名为的文件中csvfilter.py。
使用使其可执行chmod +x csvfilter.py。

然后，您可以从命令行运行它，并使用要处理的 csv 文件（我将问题中的示例保存为source.csv）作为参数：

$ ./csvfilter.py source.csv 
Test1,0.0,1
Test1,10.0,3
Test2,0.1,1
Test2,11.0,7

该脚本不会修改原始文件，而只是将新版本打印到标准输出。此外，任何以前使用空格的格式都将被丢弃。

要用修改后的版本替换原始文件，请将输出重定向回原始文件：

$ ./csvfilter.py source.csv > source.csv

您还可以将修改后的版本保存为文件：

$ ./csvfilter.py source.csv > modified.csv

Answer