我有如下遗传密码序列:ACTGgcttaTGCA
我正在尝试找出 Unix 命令来仅删除小写字符,以便字符串显示为ACTGTGCA
(已删除 gctta)。
有人能提供一些关于如何正确执行此操作的建议吗?文件太大,无法在文本编辑器中打开,因此我不能简单地执行“查找和替换”。
答案1
sed 's/[a-z]//g' yourfile >> newfile
如果您想就地编辑文件:
sed -i 's/[a-z]//g' yourfile
答案2
当然,您可以直接查找和替换,只需在流上执行此操作,而不是加载整个文件即可。通常,您会使用该工具来完成sed
此操作。这可能如下所示:
sed -r 's/[a-z]*//g' input.txt
这将匹配任意小写字符序列并将其替换为任何内容。