删除每列中包含 NA 的行

Question 1

和awk：

awk '{ for (i=2;i<=NF;i++) if ($i!="NA"){ print; break } }' file

从第二个字段开始循环遍历字段，如果NA找到不包含的字段则打印该行。然后打破循环。

Answer

和awk：

awk '{ for (i=2;i<=NF;i++) if ($i!="NA"){ print; break } }' file

从第二个字段开始循环遍历字段，如果NA找到不包含的字段则打印该行。然后打破循环。

Question 2

使用 GNU sed

sed -e '/g[0-9]\+\(\s*NA\s*\)\+$/d' filename

简短说明：

g[0-9]\+$\s*NA\s*$\+$是一个正则表达式匹配，g后跟至少一位数字，然后是任意数量的NAs，其间有可选空格，直到行尾。

sed -e '/<regex>/d'删除所有匹配的行<regex>

具有相同含义的更标准的正则表达式是：

sed -Ee '/g[0-9]+([[:space:]]*NA[[:space:]]*)+$/d' filename

Answer