我有一个大约 164 个 SNP 的列表,我需要将其与数据库中的一个非常大的 .txt 文件相匹配,并从该文本文件中提取与这些 SNP 匹配的一些列和行,并将其打印到一个新的文本文件中。
答案1
有关数据格式的一些详细信息会很有帮助。由于没有任何细节,我们必须做出一些假设:
- SNP 在某些文件中每行列出一个
- 您的数据行以空格分隔
- 出现在该行任意位置的 SNP 符合该行的匹配条件
- 我们需要每个匹配行的第 1、2 和 3 列
在这种情况下,请尝试以下操作:
grep -f list_of_SNPs.txt very_large.txt | cut -f 1,2,3 > new_file.txt