如何在块中有效地对访问日志进行排序

Question 1

tail -f access_log | awk -v 'cmd=sort --OPTION-IN-QUESTION | uniq -c' '
    {print $4, $1 | cmd}
    NR % 1000 == 0 {close(cmd)}'

Answer

tail -f access_log | awk -v 'cmd=sort --OPTION-IN-QUESTION | uniq -c' '
    {print $4, $1 | cmd}
    NR % 1000 == 0 {close(cmd)}'

Question 2

尝试split --filter：

split --lines 1000 --filter 'sort ... | sed ... | uniq -c' access.log

这将分成access.log1000 行的块，并通过给定的过滤器对每个块进行管道传输。

如果要单独保存每个块的结果，可以$FILE在过滤器命令中使用并可能指定前缀（默认为x）：

split --lines 1000 --filter '... | uniq -c >$FILE' access.log myanalysis-

这将生成一个文件，其中包含处理第一个块、第二个块等myanalysis-aa的结果。myanalysis-ab

该--filter选项split是在 GNU coreutils 8.13（2011 年 9 月发布）中引入的。

Answer

尝试split --filter：

split --lines 1000 --filter 'sort ... | sed ... | uniq -c' access.log

这将分成access.log1000 行的块，并通过给定的过滤器对每个块进行管道传输。

如果要单独保存每个块的结果，可以$FILE在过滤器命令中使用并可能指定前缀（默认为x）：

split --lines 1000 --filter '... | uniq -c >$FILE' access.log myanalysis-

这将生成一个文件，其中包含处理第一个块、第二个块等myanalysis-aa的结果。myanalysis-ab

该--filter选项split是在 GNU coreutils 8.13（2011 年 9 月发布）中引入的。

Question 3

sort它不是万能的灵丹妙药，您应该使用其他适当的工具在数据到达之前对其进行过滤sort。tail应该可以完成这项工作。例如，要对最后 100 行进行排序，您可以这样做：

tail -100 /var/log/foo.log | sort

Answer

sort它不是万能的灵丹妙药，您应该使用其他适当的工具在数据到达之前对其进行过滤sort。tail应该可以完成这项工作。例如，要对最后 100 行进行排序，您可以这样做：

tail -100 /var/log/foo.log | sort

Question 4

如果您只想对文件的一部分进行排序，您可以使用例如sed.

对第 15000 至 25000 行进行排序：

sed -n '15000,25000p' | sort

如果您要保留排序的文件，您也可以考虑split。

见人split。

Answer

如果您只想对文件的一部分进行排序，您可以使用例如sed.

对第 15000 至 25000 行进行排序：

sed -n '15000,25000p' | sort

如果您要保留排序的文件，您也可以考虑split。

见人split。

相关内容