使用制表符作为字段分隔符在 awk 内排序

Question 1

选择以下选项之一：

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011是八位字节 ASCII 代码标签字符/\047用于单引号 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

还有很多 …;读awk 中的 Shell 引用问题; 也可以看看awk 中的转义序列

Answer

选择以下选项之一：

... | "sort -k2 -t \\\t "

... | "sort -k2 -t \"\t\" "

... | "sort -k2 -t'\''\t'\'' "

... | "sort -k2 -t \047\011\047" ## preferred

\011是八位字节 ASCII 代码标签字符/\047用于单引号 '

awk -v q="'" ... { print | "sort -k2 -t " q "\t" q }'

awk -v tb="'\t'" ... { print | "sort -k2 -t " tb }'

awk -v tb=$'\t' ... { print | "sort -k2 -t \"" tb "\"" }'

awk -v tb=$'\t' -v q="'" ... { print | "sort -k2 -t " q tb q }'

还有很多 …;读awk 中的 Shell 引用问题; 也可以看看awk 中的转义序列

Question 2

这可能不是一种正确的单行方式，但很简单，不需要使用制表符......：D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Answer

这可能不是一种正确的单行方式，但很简单，不需要使用制表符......：D

var=$(head -1 file.tsv);perl -ne '{ print $_ if $. > 1; }'  file.csv| sort -k2 | sed "1 i $var" | column -ts "\t"

Question 3

FWIW这是我如何解决对数据进行排序但保留顶部标题的实际问题：

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

上面的工作原理是在输入数据前面添加 0 或 1（0 表示第一行，1 表示所有其他行），这样您就可以首先对该指标进行排序，然后对您关心的真正键进行排序，然后再次删除该添加的字段。

这是分阶段工作的：

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

Answer

FWIW这是我如何解决对数据进行排序但保留顶部标题的实际问题：

awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-

上面的工作原理是在输入数据前面添加 0 或 1（0 表示第一行，1 表示所有其他行），这样您就可以首先对该指标进行排序，然后对您关心的真正键进行排序，然后再次删除该添加的字段。

这是分阶段工作的：

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv
0   head_1  head_2  head_3
1   aaa zzz c   300
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3
0   head_1  head_2  head_3
1   bbb yyy ooo a   100
1   ccc xxx nnn b   200
1   aaa zzz c   300

$ awk -v OFS='\t' '{print (NR>1), $0}' file.tsv | sort -t$'\t' -k1,1n -k3 | cut -f2-
head_1  head_2  head_3
bbb yyy ooo a   100
ccc xxx nnn b   200
aaa zzz c   300

使用制表符作为字段分隔符在 awk 内排序

答案1

答案2

答案3

相关内容