过滤掉不一致的数据块

Question

我认为最简单的事情是首先对输入进行排序。此解决方案避免使用数组，这会限制您可以处理的输入文件的大小。

如果排序不是问题，那么这应该可行：

sort file | awk '{
        if ($1$2 != key) {
                if (valid == 1)
                        print firstline;
                firstline=$0;
                key=$1$2;
                value=$4;
                valid=1
        }
        else {
                if ($4 != value)
                        valid = 0
        }
} END {
        if (valid == 1)
                print firstline
}'

Answer 1

我认为最简单的事情是首先对输入进行排序。此解决方案避免使用数组，这会限制您可以处理的输入文件的大小。

如果排序不是问题，那么这应该可行：

sort file | awk '{
        if ($1$2 != key) {
                if (valid == 1)
                        print firstline;
                firstline=$0;
                key=$1$2;
                value=$4;
                valid=1
        }
        else {
                if ($4 != value)
                        valid = 0
        }
} END {
        if (valid == 1)
                print firstline
}'

过滤掉不一致的数据块

答案1

相关内容