查找与另一个文件匹配的行并将它们存储在单独的文件中

Question 1

和awk：

awk -F_ '
  NR==FNR {ind[substr($1,1,3)]++} 
  {i = substr($3,1,3); f = i ".population"} 
  i in ind {print >> f; close(f)}
' pop.file ind.file

然后

$ head HG*
==> HG1.population <==
HI.2613.007.Index_18.ED17_HG1W26-7_353_R1.fastq.gz
HI.2613.007.Index_18.ED17_HG1W26-7_353_R2.fastq.gz
HI.2613.007.Index_14.ED14_HG1W35-2_310_R1.fastq.gz
HI.2613.007.Index_14.ED14_HG1W35-2_310_R2.fastq.gz

==> HG2.population <==
HI.2622.001.Index_16.ED16_HG2W9-3_342_R1.fastq.gz
HI.2622.001.Index_16.ED16_HG2W9-3_342_R2.fastq.gz
HI.2613.007.Index_1.ED1_HG2W12-3_33_R1.fastq.gz
HI.2613.007.Index_1.ED1_HG2W12-3_33_R2.fastq.gz

Answer

和awk：

awk -F_ '
  NR==FNR {ind[substr($1,1,3)]++} 
  {i = substr($3,1,3); f = i ".population"} 
  i in ind {print >> f; close(f)}
' pop.file ind.file

然后

$ head HG*
==> HG1.population <==
HI.2613.007.Index_18.ED17_HG1W26-7_353_R1.fastq.gz
HI.2613.007.Index_18.ED17_HG1W26-7_353_R2.fastq.gz
HI.2613.007.Index_14.ED14_HG1W35-2_310_R1.fastq.gz
HI.2613.007.Index_14.ED14_HG1W35-2_310_R2.fastq.gz

==> HG2.population <==
HI.2622.001.Index_16.ED16_HG2W9-3_342_R1.fastq.gz
HI.2622.001.Index_16.ED16_HG2W9-3_342_R2.fastq.gz
HI.2613.007.Index_1.ED1_HG2W12-3_33_R1.fastq.gz
HI.2613.007.Index_1.ED1_HG2W12-3_33_R2.fastq.gz

Question 2

尝试这个，

for i in `cat pop.file | cut -c -3`
do
    grep $i ind.file > $i.population
done

Answer

尝试这个，

for i in `cat pop.file | cut -c -3`
do
    grep $i ind.file > $i.population
done

查找与另一个文件匹配的行并将它们存储在单独的文件中

答案1

答案2

相关内容