使用另一个文件提取与 grep 匹配的行的一部分以及以下行，然后保存到新文件

Question 1

正如他们所说，剥猫皮的方法不止一种：

grep -F -f File2.txt -A 1 File1.fasta > File3.log

< File2.txt sed -e 's|[.]|\\&|g; s|.*|g/^>&/.,.+1W File3.log|' | ed -s - File1.fasta

在这里，我们使序列标识符适合ed动态生成批处理脚本。然后传递给ed它使用它来处理你的fasta文件并将结果存储在File3.log

Answer

正如他们所说，剥猫皮的方法不止一种：

grep -F -f File2.txt -A 1 File1.fasta > File3.log

< File2.txt sed -e 's|[.]|\\&|g; s|.*|g/^>&/.,.+1W File3.log|' | ed -s - File1.fasta

在这里，我们使序列标识符适合ed动态生成批处理脚本。然后传递给ed它使用它来处理你的fasta文件并将结果存储在File3.log

Question 2

如果你的序列总是在一行上（这不是标准的 fasta 格式，顺便说一句，fasta 通常每行有 60 个字符），这是微不足道的。只需使用grepwith-A 1打印匹配行和下一行，并-f为其提供要搜索的模式列表：

grep -A1 -f File2.txt File1.fasta

但是，如果您调用了一个序列>foobar并命名了另一个序列>foo并且您搜索foo.在这种情况下它将打印两者。有关更复杂的解决方案，请参阅我的答案这里。如果您想要retrievesqs.pl 脚本，请告诉我，那里的链接不再提供该脚本。我需要更新该答案。

Answer

如果你的序列总是在一行上（这不是标准的 fasta 格式，顺便说一句，fasta 通常每行有 60 个字符），这是微不足道的。只需使用grepwith-A 1打印匹配行和下一行，并-f为其提供要搜索的模式列表：

grep -A1 -f File2.txt File1.fasta

但是，如果您调用了一个序列>foobar并命名了另一个序列>foo并且您搜索foo.在这种情况下它将打印两者。有关更复杂的解决方案，请参阅我的答案这里。如果您想要retrievesqs.pl 脚本，请告诉我，那里的链接不再提供该脚本。我需要更新该答案。

Question 3

是否有 20 个标识符中每一个的 txt 文件？然后假设它们被称为sequence1.txt等等（请适应），做

for file in sequence*.txt; do
  id=`grep AB $file`
  grep $id -A1 $file1.fasta |grep -v $id
done

第二行假设 id 始终包含AB.如果不是，也许它总是第一行，然后使用它head -1 $file。

第三行提取 id 行和后续行。第二个 grep 删除 id 行。如果您想要 id 行和序列一起输出，则可以将其删除，这样您就知道哪个序列对应哪个 id。

使用附加grep选项，-m1您可以稍微加快搜索速度，因为您知道，文件中只有一个匹配项。

Answer

是否有 20 个标识符中每一个的 txt 文件？然后假设它们被称为sequence1.txt等等（请适应），做

for file in sequence*.txt; do
  id=`grep AB $file`
  grep $id -A1 $file1.fasta |grep -v $id
done

第二行假设 id 始终包含AB.如果不是，也许它总是第一行，然后使用它head -1 $file。

第三行提取 id 行和后续行。第二个 grep 删除 id 行。如果您想要 id 行和序列一起输出，则可以将其删除，这样您就知道哪个序列对应哪个 id。

使用附加grep选项，-m1您可以稍微加快搜索速度，因为您知道，文件中只有一个匹配项。

相关内容