使用 awk sub 函数对 fasta 标头进行顺序编号

Question 1

你很接近，只需将++i带引号的子字符串之外的内容取出"> ++i"即可"> " ++i。

awk '/^>/{sub(">", "> "++i " ")}1' infile

Answer

你很接近，只需将++i带引号的子字符串之外的内容取出"> ++i"即可"> " ++i。

awk '/^>/{sub(">", "> "++i " ")}1' infile

Question 2

正如 αГsнιn 指出的，您将++i作为文字字符串的一部分插入。

另一种解决方案，可能看起来更漂亮一些：

awk -F '>' '/^>/ { $1 = "> " ++i } { print }' file.fa

或者，如果您喜欢的简写{ print }，

awk -F '>' '/^>/ { $1 = "> " ++i } 1' file.fa

它用作输入字段分隔符，并用所需的字符串替换任何标题行上的第一个字段（输入中为空的>之前的位）。>

Answer

正如 αГsнιn 指出的，您将++i作为文字字符串的一部分插入。

另一种解决方案，可能看起来更漂亮一些：

awk -F '>' '/^>/ { $1 = "> " ++i } { print }' file.fa

或者，如果您喜欢的简写{ print }，

awk -F '>' '/^>/ { $1 = "> " ++i } 1' file.fa

它用作输入字段分隔符，并用所需的字符串替换任何标题行上的第一个字段（输入中为空的>之前的位）。>

相关内容