使用 grep/awk/sed 对 2 个文件进行排序和合并

Question 1

join合并文件（需要排序的输入）：

$ join <(sort text.txt) <(sort vendor.xml)
00:10:f6 vendor="micro"
00:10:f6 vendor="micro"
03:48:03 vendor="apple"
8f:91:34 vendor="dell"
93:ab:c6 vendor="sun"

所以剩下的就是添加uniq -c来进行计数：

$ join <(sort text.txt) <(sort vendor.xml) | uniq -c
      2 00:10:f6 vendor="micro"
      1 03:48:03 vendor="apple"
      1 8f:91:34 vendor="dell"
      1 93:ab:c6 vendor="sun"

Answer

join合并文件（需要排序的输入）：

$ join <(sort text.txt) <(sort vendor.xml)
00:10:f6 vendor="micro"
00:10:f6 vendor="micro"
03:48:03 vendor="apple"
8f:91:34 vendor="dell"
93:ab:c6 vendor="sun"

所以剩下的就是添加uniq -c来进行计数：

$ join <(sort text.txt) <(sort vendor.xml) | uniq -c
      2 00:10:f6 vendor="micro"
      1 03:48:03 vendor="apple"
      1 8f:91:34 vendor="dell"
      1 93:ab:c6 vendor="sun"

Question 2

这是 awk 的答案：

awk 'NR==FNR {count[$0]++; next} $1 in count {print count[$1],$0}' text.txt vendor.xml | sort -nr

Answer

这是 awk 的答案：

awk 'NR==FNR {count[$0]++; next} $1 in count {print count[$1],$0}' text.txt vendor.xml | sort -nr

Question 3

您的前两个命令没有执行任何操作。您正在捕获这两个文件并将它们传递给 grep，它会忽略它，因为您已经给了它一个要搜索的文件。您只需要

grep -Ff text.txt vendor.xml | sort -u | uniq -c

这并不像你期望的那样工作，因为grep它比那更聪明。当你给它一个要查找的模式列表时，它会忽略重复项。这意味着它只为00:10:f6中的两行打印一行text.txt：

$ grep -Ff text.txt vendor.xml 
03:48:03 vendor="apple"
00:10:f6 vendor="micro"
8f:91:34 vendor="dell"
93:ab:c6 vendor="sun"

至于你想要做什么，其他人已经给了你很好的建议，但这里有一个 perl 的建议：

$ perl -lane '$#F>0 ? $k{$F[0]} && print "$k{$F[0]} $_" : $k{$_}++;' text.txt vendor.xml 
1 03:48:03 vendor="apple"
2 00:10:f6 vendor="micro"
1 8f:91:34 vendor="dell"
1 93:ab:c6 vendor="sun"

Answer

您的前两个命令没有执行任何操作。您正在捕获这两个文件并将它们传递给 grep，它会忽略它，因为您已经给了它一个要搜索的文件。您只需要

grep -Ff text.txt vendor.xml | sort -u | uniq -c

这并不像你期望的那样工作，因为grep它比那更聪明。当你给它一个要查找的模式列表时，它会忽略重复项。这意味着它只为00:10:f6中的两行打印一行text.txt：

$ grep -Ff text.txt vendor.xml 
03:48:03 vendor="apple"
00:10:f6 vendor="micro"
8f:91:34 vendor="dell"
93:ab:c6 vendor="sun"

至于你想要做什么，其他人已经给了你很好的建议，但这里有一个 perl 的建议：

$ perl -lane '$#F>0 ? $k{$F[0]} && print "$k{$F[0]} $_" : $k{$_}++;' text.txt vendor.xml 
1 03:48:03 vendor="apple"
2 00:10:f6 vendor="micro"
1 8f:91:34 vendor="dell"
1 93:ab:c6 vendor="sun"

使用 grep/awk/sed 对 2 个文件进行排序和合并

答案1

答案2

答案3

相关内容