使用具有名称信息的其他文件替换文件头

Question

好吧，这可能不是最优雅的解决方案，但这就是我想出的

sed -i 's/ .*//g' *.fas

for f in OG000*.fas; do grep ">" $f > ${f%.fas}.names; done
for f in *.names; do grep -w -Ef $f names > ${f%.names}.rep; done

sed -i 's/ .*//g' *.rep

for f in OG000*.fas; do awk -vRS="\n" -vORS="\t" '1' $f  | sed -e 's/\t>/\n>/g' > ${f}_file1; done
for f in *.rep; do awk -vRS=":" -vORS="\t" '1' $f | awk '{ $(NF+1)=$1; sub(/^[^ ]+ */,"") }1' > ${f}_file2; done

for f in *.rep_file2; do awk '
NR==FNR {vals[$1] = $2 " " $3 " " $4; next} 
!($1 in vals) {vals[$1] = "0 0 0"} 
{$(NF+1) = vals[$1]; print}
' $f ${f%rep_file2}fas_file1 | awk '{print $3,$2}' | sed -e 's/ /\n/g'     | sed -e 's/.faa//g' | sed "/DBSCAN/ s/^/>/" | sed "/.assembled/ s/^/>/" | sed "/_protein/ s/^/>/" > ${f}output; done

Answer 1

好吧，这可能不是最优雅的解决方案，但这就是我想出的

sed -i 's/ .*//g' *.fas

for f in OG000*.fas; do grep ">" $f > ${f%.fas}.names; done
for f in *.names; do grep -w -Ef $f names > ${f%.names}.rep; done

sed -i 's/ .*//g' *.rep

for f in OG000*.fas; do awk -vRS="\n" -vORS="\t" '1' $f  | sed -e 's/\t>/\n>/g' > ${f}_file1; done
for f in *.rep; do awk -vRS=":" -vORS="\t" '1' $f | awk '{ $(NF+1)=$1; sub(/^[^ ]+ */,"") }1' > ${f}_file2; done

for f in *.rep_file2; do awk '
NR==FNR {vals[$1] = $2 " " $3 " " $4; next} 
!($1 in vals) {vals[$1] = "0 0 0"} 
{$(NF+1) = vals[$1]; print}
' $f ${f%rep_file2}fas_file1 | awk '{print $3,$2}' | sed -e 's/ /\n/g'     | sed -e 's/.faa//g' | sed "/DBSCAN/ s/^/>/" | sed "/.assembled/ s/^/>/" | sed "/_protein/ s/^/>/" > ${f}output; done

使用具有名称信息的其他文件替换文件头

答案1

相关内容