在日志文件中搜索文本模式

Question 1

它看起来像一个简单的网络服务器日志。答案就像grep和一样简单awk。

让日志文件的名称为httpd.log.您可以尝试这个复合命令：

grep -o 'GET \/product\/[^/]*\/' httpd.log |awk 'BEGIN{FS="\/"}{AA[$3]++}END{for(i in AA){print AA[i]" "i}}'|sort -n -r|awk '{print $2","$1}' |head -n20

第一部分隔离重要文本（如果存在），第二部分对产品编号的每次出现进行计数并打印结果，第三部分对列表进行排序，最后两个部分以您指定的形式打印它。

如果您想将每一天分开，您可以在该命令之前加上另一个命令grep来指定日期。

要过滤 IP 客户端，您可以按照上面所示的示例自行尝试。

Answer

它看起来像一个简单的网络服务器日志。答案就像grep和一样简单awk。

让日志文件的名称为httpd.log.您可以尝试这个复合命令：

grep -o 'GET \/product\/[^/]*\/' httpd.log |awk 'BEGIN{FS="\/"}{AA[$3]++}END{for(i in AA){print AA[i]" "i}}'|sort -n -r|awk '{print $2","$1}' |head -n20

第一部分隔离重要文本（如果存在），第二部分对产品编号的每次出现进行计数并打印结果，第三部分对列表进行排序，最后两个部分以您指定的形式打印它。

如果您想将每一天分开，您可以在该命令之前加上另一个命令grep来指定日期。

要过滤 IP 客户端，您可以按照上面所示的示例自行尝试。

Question 2

awk -v pat="GET /product/[0-9]*" -F'[[:blank:]:[]' '
BEGIN           {PROCINFO["sorted_in"]="@val_num_desc"}
$0 ~ pat        {match($0, pat)
                 A[substr($0, RSTART+13, RLENGTH-13)]++}
!C[$5,$1]++     {D[$5]++}
END             {for(i in A){if(++j > 20) break; print i "," A[i]}
                 for(i in D) print i "," D[i]}
' file

BEGIN {PROCINFO["sorted_in"]="@val_num_desc"}- 通过数组元素，设置按值降序排序。
$0 ~ pat {match($0, pat);A[substr($0, RSTART+13, RLENGTH-13)]++}- 创建一个数组，键与产品编号对应，数量计入值中。
!C[$5,$1]++ {D[$5]++}- 计算唯一值。验证密钥由日期和 IP 组成。
END {for(i in A){ if(++j > 20) break; print i "," A[i]}- 根据A)点打印数组的前20个键和值。
for(i in D) print i "," D[i]}- 打印出值和按值排序的键。

如果您需要按最后一点的日期排序，可以将输出重定向到 shell 命令。更改最后一行：

for(i in D) print i "," D[i] | "sort -rt\"/\" -k3,3 -k2,2 -k1,1"}

Answer

awk -v pat="GET /product/[0-9]*" -F'[[:blank:]:[]' '
BEGIN           {PROCINFO["sorted_in"]="@val_num_desc"}
$0 ~ pat        {match($0, pat)
                 A[substr($0, RSTART+13, RLENGTH-13)]++}
!C[$5,$1]++     {D[$5]++}
END             {for(i in A){if(++j > 20) break; print i "," A[i]}
                 for(i in D) print i "," D[i]}
' file

BEGIN {PROCINFO["sorted_in"]="@val_num_desc"}- 通过数组元素，设置按值降序排序。
$0 ~ pat {match($0, pat);A[substr($0, RSTART+13, RLENGTH-13)]++}- 创建一个数组，键与产品编号对应，数量计入值中。
!C[$5,$1]++ {D[$5]++}- 计算唯一值。验证密钥由日期和 IP 组成。
END {for(i in A){ if(++j > 20) break; print i "," A[i]}- 根据A)点打印数组的前20个键和值。
for(i in D) print i "," D[i]}- 打印出值和按值排序的键。

如果您需要按最后一点的日期排序，可以将输出重定向到 shell 命令。更改最后一行：

for(i in D) print i "," D[i] | "sort -rt\"/\" -k3,3 -k2,2 -k1,1"}

在日志文件中搜索文本模式

答案1

答案2

相关内容