如何查找两个文件之间的相似之处?

如何查找两个文件之间的相似之处?

你好,我是 Linux 新手,我有两个文件,其中一个有sequence_id(file_1),另一个有sequence_id和sequence(file_1)。如果 file_1 中存在的sequence_id(file_1)要存储在新文件中,我必须这样做。

例子: 文件_1

lcl|NW_002477239.1_gene_517
lcl|NW_002477243.1_gene_364
lcl|NW_002477248.1_gene_148
lcl|NW_002477249.1_gene_419
lcl|NW_002477249.1_gene_95 

文件_2

>lcl|NW_002477253.1_gene_1
TGATGGAAGCTTCCAATTCTCCCGACCAACAATCAGTGCTCAGTGAATCTATCCTTGTTAGCGAGTCGCTTGTTCCA
>lcl|NW_002477239.1_gene_517
ATGGCTGATTTTGCAAAGGATCCTGCTCTCAACGCAGCATTATCTGCACCATGGGCGTTTCTCTGCCCTACATCAGAATTAAACGATACCATA

预期产出

>lcl|NW_002477239.1_gene_517
ATGGCTGATTTTGCAAAGGATCCTGCTCTCAACGCAGCATTATCTGCACCATGGGCGTTTCTCTGCCCTACATCAGAATTAAACGATACCATA

请帮我解决这个问题。

答案1

您可以使用此 bash 脚本来获取匹配结果

!#/bin/bash
while read line
do
     grep $line File_2 >> file
done <./File_1

相关内容