计算一个文件中的模式在另一个文件中出现次数的优雅方法

Question 1

一些简单的事情，比如：

mapfile -t names < file1
for name in "${names[@]}"
do
  echo "${name}" $(grep -c "^$name " file2)
done

将提供如下输出：

Peht 2
Mawo 3
Stso 1
Makr 0
Bavo 2

grep 字符串表示将用户名锚定在行的开头 (^)，并在行后强制添加尾随空格。

Answer

一些简单的事情，比如：

mapfile -t names < file1
for name in "${names[@]}"
do
  echo "${name}" $(grep -c "^$name " file2)
done

将提供如下输出：

Peht 2
Mawo 3
Stso 1
Makr 0
Bavo 2

grep 字符串表示将用户名锚定在行的开头 (^)，并在行后强制添加尾随空格。

Question 2

测试.awk：

FNR == NR{ 
  names[$1]
  next
}   
($1 in names){
  ulog[$1]++
}   
END{
  for(name in ulog){
    print name ":" ulog[name]
  }   
}

并将其运行为 awk -f test.awk user.list user.log

FNR==NR # 文件记录号==记录号，如果是那么我们仍然在第一个文件

next # 因为我们仍在第一个文件中，所以跳过其余部分并拉入下一行

其余的应该是不言自明的

或作为单行

awk 'FNR == NR{ names[$1]; next } ($1 in names){ ulog[$1]++ } END{ for(name in ulog){ print name ":" ulog[name] } }' user.list user.log

Answer

测试.awk：

FNR == NR{ 
  names[$1]
  next
}   
($1 in names){
  ulog[$1]++
}   
END{
  for(name in ulog){
    print name ":" ulog[name]
  }   
}

并将其运行为 awk -f test.awk user.list user.log

FNR==NR # 文件记录号==记录号，如果是那么我们仍然在第一个文件

next # 因为我们仍在第一个文件中，所以跳过其余部分并拉入下一行

其余的应该是不言自明的

或作为单行

awk 'FNR == NR{ names[$1]; next } ($1 in names){ ulog[$1]++ } END{ for(name in ulog){ print name ":" ulog[name] } }' user.list user.log

Question 3

这是 // 的另join一种sort方式uniq：

join  -1 1 -2 2 -a1 -e "0" -o 1.1 2.1 <(sort file1) \
<(cut -d' ' -f1 file2 | sort | uniq -c)

基本上，它将名称file1与unique 名称连接起来，并根据file2使用0中缺少的字段进行计数file2。

我awk会运行：

awk 'NR==FNR{s[$1]++;next}
{if ($1 in s) {print $1, s[$1]}
else {print $1, 0}}' file2 file1

首先读取file2，计算每个名称出现的次数，然后读取file1并为每个名称打印计数file2（如果名称不在其中，则file2打印 0）。

Answer

这是 // 的另join一种sort方式uniq：

join  -1 1 -2 2 -a1 -e "0" -o 1.1 2.1 <(sort file1) \
<(cut -d' ' -f1 file2 | sort | uniq -c)

基本上，它将名称file1与unique 名称连接起来，并根据file2使用0中缺少的字段进行计数file2。

我awk会运行：

awk 'NR==FNR{s[$1]++;next}
{if ($1 in s) {print $1, s[$1]}
else {print $1, 0}}' file2 file1

首先读取file2，计算每个名称出现的次数，然后读取file1并为每个名称打印计数file2（如果名称不在其中，则file2打印 0）。

相关内容