Sort -u 不排序但具有更好的唯一性？

Question

我会使用 perl 和哈希。

就像是：

 #!/usr/bin/perl

 use strict;
 use warnings;

 my %seen; 

 while ( <> ) { 
     print unless $seen{$_}++; 
 }

我认为这可以简单地理解为：

perl -ne 'print unless $seen{$_}++' data.txt

（或者猫数据进入其中）。

这适用于获取唯一的整行 - 您还可以使用拆分或正则表达式来比较子集。

例如

while ( <> ) { 
    my @fields = split ( ";" ); 
    print unless $seen{$fields[4]}++; 
}

将根据将该行拆分为字段;，并仅比较第 5 个字段（数组中第一个字段为零）。

Answer 1

我会使用 perl 和哈希。

就像是：

 #!/usr/bin/perl

 use strict;
 use warnings;

 my %seen; 

 while ( <> ) { 
     print unless $seen{$_}++; 
 }

我认为这可以简单地理解为：

perl -ne 'print unless $seen{$_}++' data.txt

（或者猫数据进入其中）。

这适用于获取唯一的整行 - 您还可以使用拆分或正则表达式来比较子集。

例如

while ( <> ) { 
    my @fields = split ( ";" ); 
    print unless $seen{$fields[4]}++; 
}

将根据将该行拆分为字段;，并仅比较第 5 个字段（数组中第一个字段为零）。

相关内容