Bash：按标记分组的日志文件中使用的字节数

Question

尝试：

awk -F "|" '{ a[$5]+=1+length($0) } END{for (name in a) print name,a[name]}' trace.log

让我们考虑这个测试文件：

$ cat trace.log
1|2|3|4|jerry|6
a|b|c|d|phil|f
1|2|3|4|jerry|6

原始命令产生以下输出：

$ awk -F "|" '{ print $5 }' trace.log | sort | uniq | xargs -l sh -c 'echo -n $0 && grep "$0" trace.log | wc -c'
jerry32
phil15

建议的命令仅循环遍历文件一次，产生以下输出：

$ awk -F "|" '{ a[$5]+=1+length($0) } END{for (name in a) print name,a[name]}' trace.log
jerry 32
phil 15

-F "|"

这将设置输入的字段分隔符。
a[$5]+=1+length($0)

对于每一行，我们将该行的长度添加到a该行用户名下的关联数组中存储的计数中。

该数量length($0)不包括行尾的换行符。因此，我们在此基础上加一以说明\n。
END{for (name in a) print name,a[name]}

我们读完文件一次后，就打印出总数。

Answer 1

尝试：

awk -F "|" '{ a[$5]+=1+length($0) } END{for (name in a) print name,a[name]}' trace.log

让我们考虑这个测试文件：

$ cat trace.log
1|2|3|4|jerry|6
a|b|c|d|phil|f
1|2|3|4|jerry|6

原始命令产生以下输出：

$ awk -F "|" '{ print $5 }' trace.log | sort | uniq | xargs -l sh -c 'echo -n $0 && grep "$0" trace.log | wc -c'
jerry32
phil15

建议的命令仅循环遍历文件一次，产生以下输出：

$ awk -F "|" '{ a[$5]+=1+length($0) } END{for (name in a) print name,a[name]}' trace.log
jerry 32
phil 15

-F "|"

这将设置输入的字段分隔符。
a[$5]+=1+length($0)

对于每一行，我们将该行的长度添加到a该行用户名下的关联数组中存储的计数中。

该数量length($0)不包括行尾的换行符。因此，我们在此基础上加一以说明\n。
END{for (name in a) print name,a[name]}

我们读完文件一次后，就打印出总数。

相关内容