使用 grep 将与模式匹配的第一行中的所有行返回到不同的模式

Question 1

正如您所发现的，grep -A它不灵活，因为它只允许指定静态的上下文行数。

相反，这里有一个awk命令，用于检测所选序列何时发生，并将其输出，直到遇到另一个与条件不匹配的序列头：

awk -v name='trnF' -v OFS=':\t' '
    FNR == 1 && NR > 1 { print "--" }
    /^>/ { out=0 }
    $0 ~ "^>.*" name { out=1 }
    out == 1 { print FILENAME, $0 }' files

该-v name=something选项将分配something给代码name中的变量awk，并将用作与包含给定字符串的 fasta 标题行匹配的正则表达式的一部分。

最后一段的输出awk可能类似于

file:   >species one; trnF(ggc)
file:   GGCCC
file:   AACGC
--
file1:  >species one; trnF(ggc)
file1:  GGCCC
file1:  AACGC
--

（:后面的制表符用作文件名和数据之间的分隔符，可以通过OFS在命令行上设置为其他内容来更改-v OFS=somethingelse）

Answer

正如您所发现的，grep -A它不灵活，因为它只允许指定静态的上下文行数。

相反，这里有一个awk命令，用于检测所选序列何时发生，并将其输出，直到遇到另一个与条件不匹配的序列头：

awk -v name='trnF' -v OFS=':\t' '
    FNR == 1 && NR > 1 { print "--" }
    /^>/ { out=0 }
    $0 ~ "^>.*" name { out=1 }
    out == 1 { print FILENAME, $0 }' files

该-v name=something选项将分配something给代码name中的变量awk，并将用作与包含给定字符串的 fasta 标题行匹配的正则表达式的一部分。

最后一段的输出awk可能类似于

file:   >species one; trnF(ggc)
file:   GGCCC
file:   AACGC
--
file1:  >species one; trnF(ggc)
file1:  GGCCC
file1:  AACGC
--

（:后面的制表符用作文件名和数据之间的分隔符，可以通过OFS在命令行上设置为其他内容来更改-v OFS=somethingelse）

Question 2

#! /bin/bash

for i in dir/file*
do
    [ -n "$is_first_file" ] && echo
    awk -v filename="$i" 'BEGIN { temp=1 }  { if ($1 ~ /^>/ && temp == 0){exit} } {if ( $1 ~ /^>/ && temp == 1 ) {print filename,"\b:","\b"$0,temp=0 } else { print filename,"\b-","\b"$0 }}' "$i"
    echo -n '--'
    is_first_file=no
done
echo -n -e "\b\b"

没有太多经验awk，但我想这应该会给你你想要的确切输出。

也是我经常犯的一个错误。不要像那样运行这个脚本sh script_name。

它用-e在echo哪些需要的地方bash。

像./script_name或一样运行它bash script_name。

Answer

#! /bin/bash

for i in dir/file*
do
    [ -n "$is_first_file" ] && echo
    awk -v filename="$i" 'BEGIN { temp=1 }  { if ($1 ~ /^>/ && temp == 0){exit} } {if ( $1 ~ /^>/ && temp == 1 ) {print filename,"\b:","\b"$0,temp=0 } else { print filename,"\b-","\b"$0 }}' "$i"
    echo -n '--'
    is_first_file=no
done
echo -n -e "\b\b"

没有太多经验awk，但我想这应该会给你你想要的确切输出。

也是我经常犯的一个错误。不要像那样运行这个脚本sh script_name。

它用-e在echo哪些需要的地方bash。

像./script_name或一样运行它bash script_name。

使用 grep 将与模式匹配的第一行中的所有行返回到不同的模式

答案1

答案2

相关内容