如果第 5 列中有点则删除行

Question 1

你可以试试这个

awk '{ if ( $5 != "." ) { print $0; } }' input_file.Txt > output_file.txt

这将测试第五列是否不是点并显示该线。

Answer

你可以试试这个

awk '{ if ( $5 != "." ) { print $0; } }' input_file.Txt > output_file.txt

这将测试第五列是否不是点并显示该线。

Question 2

对于grep，假设列是制表符分隔的，这里使用 ksh93/zsh/bash$'...'引号：

LC_ALL=C grep -v $'^\([^\t]*\t\)\{4\}\.\t'

如果列之间有任意数量的空格分隔：

LC_ALL=C grep -vE '^([^[:blank:]]+[[:blank:]]+){4}\.[[:blank:]]'

GNUgrep通常比awk（尤其是 GNU awk）或更快sed。将语言环境设置为 C 通常也会加快速度。

Answer

对于grep，假设列是制表符分隔的，这里使用 ksh93/zsh/bash$'...'引号：

LC_ALL=C grep -v $'^\([^\t]*\t\)\{4\}\.\t'

如果列之间有任意数量的空格分隔：

LC_ALL=C grep -vE '^([^[:blank:]]+[[:blank:]]+){4}\.[[:blank:]]'

GNUgrep通常比awk（尤其是 GNU awk）或更快sed。将语言环境设置为 C 通常也会加快速度。

Question 3

awk '$5 != "."' your-big-file     # from manatwork's comment

或者

sed -n '/^ *[^ ]\+ \+[^ ]\+ \+[^ ]\+ \+[^ ]\+ \+\. /!p' your-big-file

Stephane Chazelas 评论的便携式版本：

sed -n '/^ *[^ ][^ ]*  *[^ ][^ ]*  *[^ ][^ ]*  *[^ ][^ ]*  *\. /!p' your-big-file

这sed版本假设分隔符是空格，但您可以调整它。

表现：

Namrata 说（评论）sed脚本比脚本更快awk。斯蒂芬·查泽拉斯认为grep等效的可能甚至更快......

Answer

awk '$5 != "."' your-big-file     # from manatwork's comment

或者

sed -n '/^ *[^ ]\+ \+[^ ]\+ \+[^ ]\+ \+[^ ]\+ \+\. /!p' your-big-file

Stephane Chazelas 评论的便携式版本：

sed -n '/^ *[^ ][^ ]*  *[^ ][^ ]*  *[^ ][^ ]*  *[^ ][^ ]*  *\. /!p' your-big-file

这sed版本假设分隔符是空格，但您可以调整它。

表现：

Namrata 说（评论）sed脚本比脚本更快awk。斯蒂芬·查泽拉斯认为grep等效的可能甚至更快......

相关内容