从一个大文件到另一个大文件寻找匹配项？

Question 1

遇到这种情况时，如果我不想/不能将一个文件的所有内容存储在数组中（正如 Eric 所建议的那样），我会采取一种略显不寻常的方法。每个文件都导出到数据库中的单独表中（我喜欢用 Perl 来处理这一部分），然后通过 SQL 查询获取所需的结果。

Answer

遇到这种情况时，如果我不想/不能将一个文件的所有内容存储在数组中（正如 Eric 所建议的那样），我会采取一种略显不寻常的方法。每个文件都导出到数据库中的单独表中（我喜欢用 Perl 来处理这一部分），然后通过 SQL 查询获取所需的结果。

Question 2

-F您可以使用该选项来搜索固定字符串，从而稍微加快速度。

grep -Ff fileA.txt fileB.txt

您对测试进行计时了吗？将这个时间推算到更大的文件上，会告诉你什么？

Answer

-F您可以使用该选项来搜索固定字符串，从而稍微加快速度。

grep -Ff fileA.txt fileB.txt

您对测试进行计时了吗？将这个时间推算到更大的文件上，会告诉你什么？

Question 3

排序然后比较它们？这应该可行。

Answer

排序然后比较它们？这应该可行。

Question 4

在 perl 中：

#!/usr/bin/perl -w

my ($emailfile, $file2);

if ( open ( $emailfile, '/path/file') )
{
  my @emails = split(/\n/, $emailfile);

  if ( open ( $file1, '/path/file') )
  {
    foreach my $email ( @emails )
    {
      while ( <$file2> )
      {
        if ( $_ =~ /$email/)
          print $_;
      }
    }
  }
}

Answer

在 perl 中：

#!/usr/bin/perl -w

my ($emailfile, $file2);

if ( open ( $emailfile, '/path/file') )
{
  my @emails = split(/\n/, $emailfile);

  if ( open ( $file1, '/path/file') )
  {
    foreach my $email ( @emails )
    {
      while ( <$file2> )
      {
        if ( $_ =~ /$email/)
          print $_;
      }
    }
  }
}

从一个大文件到另一个大文件寻找匹配项？

答案1

答案2

答案3

答案4

相关内容