如何不显示文件中包含所有 NULL 值的列

Question 1

借助于GNU实用程序datamash，首先反转行，然后删除所有空行并再次反转行：

$ datamash transpose | sed -Ee '/^(NULL\t)*NULL$/d' | datamash transpose

Answer

借助于GNU实用程序datamash，首先反转行，然后删除所有空行并再次反转行：

$ datamash transpose | sed -Ee '/^(NULL\t)*NULL$/d' | datamash transpose

Question 2

我不太喜欢这个解决方案，但它似乎有效：

#!/bin/bash

input=~/tmp/input
skip=()

c=$(awk '{print NF;exit}' "$input")

for ((i=1;i<=c;i++)); do
    col=$(awk -v c="$i" '{print $c}' "$input" | sort -u)
    if [[ $col == NULL ]]; then
        skip+=( "$i" )
    fi
done
( IFS=,; awk -v S="${skip[*]}" '{ split(S,s,","); for (i=1;i<=length(s);i++) { $s[i]="" } print}' "$input" )

input（您的输入文件）
skip（稍后将填充的数组）
c（将设置为文件中的列数。这假设整个文件具有统一的列数）
我们现在将循环遍历文件中的每一列，对其进行排序和唯一，并检查该列是否仅包含NULL.如果是这样，我们将该列号添加到skip数组中
现在，我们将设为IFS逗号（这是我使用子 shell 的原因），并将数组skip作为逗号分隔值传递给awk变量。这样我们就可以用来split将该变量转换回数组awk。
awk然后将循环遍历s数组中的每个数字并将该列设置为空并打印剩余的内容。

Answer

我不太喜欢这个解决方案，但它似乎有效：

#!/bin/bash

input=~/tmp/input
skip=()

c=$(awk '{print NF;exit}' "$input")

for ((i=1;i<=c;i++)); do
    col=$(awk -v c="$i" '{print $c}' "$input" | sort -u)
    if [[ $col == NULL ]]; then
        skip+=( "$i" )
    fi
done
( IFS=,; awk -v S="${skip[*]}" '{ split(S,s,","); for (i=1;i<=length(s);i++) { $s[i]="" } print}' "$input" )

input（您的输入文件）
skip（稍后将填充的数组）
c（将设置为文件中的列数。这假设整个文件具有统一的列数）
我们现在将循环遍历文件中的每一列，对其进行排序和唯一，并检查该列是否仅包含NULL.如果是这样，我们将该列号添加到skip数组中
现在，我们将设为IFS逗号（这是我使用子 shell 的原因），并将数组skip作为逗号分隔值传递给awk变量。这样我们就可以用来split将该变量转换回数组awk。
awk然后将循环遍历s数组中的每个数字并将该列设置为空并打印剩余的内容。

Question 3

如果不处理文件两次就无法做到这一点。首先使用以下命令awk构建最终cut命令：

killnulls(){
    cut -f "$(awk -F'\t' '
        { for(i=1;i<=NF;i++) a[i] += $i!="NULL" }
        END { for(i=1;i in a;i++) if(a[i]) printf j++?","i:i }
    ' "$@")" "$@"
}

$ killnulls file
1000    NULL    2
7       1000    2
7       1000    2
...

Answer

如果不处理文件两次就无法做到这一点。首先使用以下命令awk构建最终cut命令：

killnulls(){
    cut -f "$(awk -F'\t' '
        { for(i=1;i<=NF;i++) a[i] += $i!="NULL" }
        END { for(i=1;i in a;i++) if(a[i]) printf j++?","i:i }
    ' "$@")" "$@"
}

$ killnulls file
1000    NULL    2
7       1000    2
7       1000    2
...

Question 4

命令：

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' filename| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'

输出

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' i.txt| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'
1000 NULL 2
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2

Answer

命令：

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' filename| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'

输出

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' i.txt| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'
1000 NULL 2
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2

如何不显示文件中包含所有 NULL 值的列

答案1

答案2

答案3

答案4

相关内容