为什么我不能将 sed 命令分组到块中的地址之后？

Question 1

输出文件的所有行，直到匹配特定模式（以及不是输出匹配行），你可以使用

sed -n '/PATTERN/q; p;' file

这里，每个周期结束时模式空间的默认输出被禁用-n。相反，我们用明确输出每一行p。如果给定的模式匹配，我们将停止处理q。

您实际的较长命令将 21 号染色体的名称从仅更改21为chr21位于 fasta 文件的第一行，然后继续提取该染色体的 DNA，直到它到达下一个 fasta 标题行，可以写为

sed -n -e '1 { s/^>21/>chr21/p; d; }' \
       -e '/^>/q' \
       -e p <in.fasta >out.fasta

或者

sed -n '1 { s/^>21/>chr21/p; d; }; /^>/q; p' <in.fasta >out.fasta

原始表达式的问题是d开始一个新的循环（即，它强制将下一行读入模式空间，并且跳转到脚本的开头）。这意味着q永远不会被执行。

请注意，为了在非 GNU 系统上语法正确，您的原始脚本应该类似于/PATTERN/ { d; q; }.注意;后面添加的q（空格不重要）。

Answer

输出文件的所有行，直到匹配特定模式（以及不是输出匹配行），你可以使用

sed -n '/PATTERN/q; p;' file

这里，每个周期结束时模式空间的默认输出被禁用-n。相反，我们用明确输出每一行p。如果给定的模式匹配，我们将停止处理q。

您实际的较长命令将 21 号染色体的名称从仅更改21为chr21位于 fasta 文件的第一行，然后继续提取该染色体的 DNA，直到它到达下一个 fasta 标题行，可以写为

sed -n -e '1 { s/^>21/>chr21/p; d; }' \
       -e '/^>/q' \
       -e p <in.fasta >out.fasta

或者

sed -n '1 { s/^>21/>chr21/p; d; }; /^>/q; p' <in.fasta >out.fasta

原始表达式的问题是d开始一个新的循环（即，它强制将下一行读入模式空间，并且跳转到脚本的开头）。这意味着q永远不会被执行。

请注意，为了在非 GNU 系统上语法正确，您的原始脚本应该类似于/PATTERN/ { d; q; }.注意;后面添加的q（空格不重要）。

Question 2

d不只是删除模式空间：从POSIX规范

[2addr]d

删除模式空间并开始下一个循环。

（我的重点）

该q命令无法访问。

Answer

d不只是删除模式空间：从POSIX规范

[2addr]d

删除模式空间并开始下一个循环。

（我的重点）

该q命令无法访问。

Question 3

您可以使用双地址形式获得相同的输出（仅第一个匹配之前的那些行）：

sed -e '/PATTERN/,$d'

但与使用的方法不同q，这意味着sed继续读取每个输入行。这对于大型输入文件或从管道读取时可能会产生影响。

Answer

您可以使用双地址形式获得相同的输出（仅第一个匹配之前的那些行）：

sed -e '/PATTERN/,$d'

但与使用的方法不同q，这意味着sed继续读取每个输入行。这对于大型输入文件或从管道读取时可能会产生影响。

相关内容