Bash 命令/脚本从 CSV 中删除列中重复的行

Question 1

awk -F, '!seen[$1]++'

$1是第一列，酌情更改；您可以使用以逗号 ( [$1,$3])分隔的多列，也$0可以使用整行。

Answer

awk -F, '!seen[$1]++'

$1是第一列，酌情更改；您可以使用以逗号 ( [$1,$3])分隔的多列，也$0可以使用整行。

Question 2

Bash 很难，但是你能从 Bash 调用 Perl 吗？如果您的字段以逗号分隔，并且您的关键字段是第二个字段，

$ cat a.csv
11,22,33
214,22,354
6,6,6
4,5,7
1,22,1

如果还没有看到第二列，则会打印这一行：

$ perl -ne '$value = (split /,/)[1]; print unless $x{$value}++;' a.csv 
11,22,33
6,6,6
4,5,7

[1] 是列号并且从零开始。

Answer

Bash 很难，但是你能从 Bash 调用 Perl 吗？如果您的字段以逗号分隔，并且您的关键字段是第二个字段，

$ cat a.csv
11,22,33
214,22,354
6,6,6
4,5,7
1,22,1

如果还没有看到第二列，则会打印这一行：

$ perl -ne '$value = (split /,/)[1]; print unless $x{$value}++;' a.csv 
11,22,33
6,6,6
4,5,7

[1] 是列号并且从零开始。

Question 3

如果某些字段在引号内包含分隔符（不适用于 Ruby 1.8）：

$ ruby -rcsv -e 'puts CSV.parse($<).uniq{|l|l[1]}.map(&:to_csv)' <<< $'"1,9",3\n4,8\n7,3'
"1,9",3
4,8

Answer

如果某些字段在引号内包含分隔符（不适用于 Ruby 1.8）：

$ ruby -rcsv -e 'puts CSV.parse($<).uniq{|l|l[1]}.map(&:to_csv)' <<< $'"1,9",3\n4,8\n7,3'
"1,9",3
4,8

相关内容