Unix - 从字符串中删除所有小写字符

Unix - 从字符串中删除所有小写字符

我有如下遗传密码序列:ACTGgcttaTGCA我正在尝试找出 Unix 命令来仅删除小写字符,以便字符串显示为ACTGTGCA (已删除 gctta)

有人能提供一些关于如何正确执行此操作的建议吗?文件太大,无法在文本编辑器中打开,因此我不能简单地执行“查找和替换”。

答案1

sed 's/[a-z]//g' yourfile >> newfile

如果您想就地编辑文件:

sed -i 's/[a-z]//g' yourfile

答案2

当然,您可以直接查找和替换,只需在流上执行此操作,而不是加载整个文件即可。通常,您会使用该工具来完成sed此操作。这可能如下所示:

sed -r 's/[a-z]*//g' input.txt

这将匹配任意小写字符序列并将其替换为任何内容。

相关内容