根据字符串过滤文件

Question 1

perl -ane 'print if grep {$_ >= 16} ($F[5] =~ /(\d+)S/g)' file

输出

c   256 gene3   55  0   6S27M17S    *
d   16  gene4   110 9   19S25M6S    *
e   272 gene5   141 9   23S21M6S    *
f   272 gene6   139 9   24S20M6S    *

这会找到第 6 个字段中后跟“S”的所有数字。如果有任何大于或等于 16，则会打印该行。

寻找-n在perldoc perlrun

查看 perl 对单行代码所做的事情的一种很酷的方法是添加选项-MO=Deparse

$ perl -MO=Deparse -ane 'print if grep {$_ >= 16} ($F[5] =~ /(\d+)S/g)'
LINE: while (defined($_ = <ARGV>)) {
    our(@F) = split(' ', $_, 0);
    print $_ if grep {$_ >= 16;} $F[5] =~ /(\d+)S/g;
}
-e syntax OK

看
http://perldoc.perl.org/B/Deparse.html
http://perldoc.perl.org/O.html

我将通过将一行展开为脚本来进行解释：

#!/usr/bin/env perl
my $filename = shift @ARGV;
open my $fh, '<', $filename or die $!;
while (defined($_ = <$fh>)) {
    my @F = split(' ', $_, 0);
    my @s_numbers = $F[5] =~ /(\d+)S/g;
    if (grep {$_ >= 16;} @s_numbers) {
        print $_;
    }
}
close $fh;

Answer

perl -ane 'print if grep {$_ >= 16} ($F[5] =~ /(\d+)S/g)' file

输出

c   256 gene3   55  0   6S27M17S    *
d   16  gene4   110 9   19S25M6S    *
e   272 gene5   141 9   23S21M6S    *
f   272 gene6   139 9   24S20M6S    *

这会找到第 6 个字段中后跟“S”的所有数字。如果有任何大于或等于 16，则会打印该行。

寻找-n在perldoc perlrun

查看 perl 对单行代码所做的事情的一种很酷的方法是添加选项-MO=Deparse

$ perl -MO=Deparse -ane 'print if grep {$_ >= 16} ($F[5] =~ /(\d+)S/g)'
LINE: while (defined($_ = <ARGV>)) {
    our(@F) = split(' ', $_, 0);
    print $_ if grep {$_ >= 16;} $F[5] =~ /(\d+)S/g;
}
-e syntax OK

看
http://perldoc.perl.org/B/Deparse.html
http://perldoc.perl.org/O.html

我将通过将一行展开为脚本来进行解释：

#!/usr/bin/env perl
my $filename = shift @ARGV;
open my $fh, '<', $filename or die $!;
while (defined($_ = <$fh>)) {
    my @F = split(' ', $_, 0);
    my @s_numbers = $F[5] =~ /(\d+)S/g;
    if (grep {$_ >= 16;} @s_numbers) {
        print $_;
    }
}
close $fh;

Question 2

假设第二个S也很重要：

awk '{
split ($6, nums, /S([0-9]+M)?/); 
for (i in nums) 
  if (nums[i] > 16) 
    { print; next }
}' test.txt

Answer

假设第二个S也很重要：

awk '{
split ($6, nums, /S([0-9]+M)?/); 
for (i in nums) 
  if (nums[i] > 16) 
    { print; next }
}' test.txt

根据字符串过滤文件

答案1

答案2

相关内容