如何分隔由下划线连接的基因名称？

Question 1

sed 's/\(\.[0-9]\)\(_\)/\1 /' inputfile | column -t

正则表达式/\.[0-9]_/似乎与您的情况匹配，因此我使用括号将其分成两个反向引用组，并打印第一组和一些空格，从而分隔您的列，然后可以使用column -t.

Answer

sed 's/\(\.[0-9]\)\(_\)/\1 /' inputfile | column -t

正则表达式/\.[0-9]_/似乎与您的情况匹配，因此我使用括号将其分成两个反向引用组，并打印第一组和一些空格，从而分隔您的列，然后可以使用column -t.

Question 2

看起来您要替换的下划线总是在一个点.后跟一个数字[0-9]。

sed 's|\.\([0-9]\)_|.\1\t|'

这将搜索一个文字点，\.后跟一个数字，我们将其保存在一个组中，\([0-9]\)后跟一个下划线_。将其替换为一个点、我们保存的第一个组\1和一个 tab \t。

Answer

看起来您要替换的下划线总是在一个点.后跟一个数字[0-9]。

sed 's|\.\([0-9]\)_|.\1\t|'

这将搜索一个文字点，\.后跟一个数字，我们将其保存在一个组中，\([0-9]\)后跟一个下划线_。将其替换为一个点、我们保存的第一个组\1和一个 tab \t。

相关内容